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提要 





Direct3D 是 微软 公司 DirectX SDK 集 成 开发 包 中 的 重要 组 成 部 分 ， 是 
编写 高 性 能 3D 图 形 应 用 程序 的 泻 染 库 ， 适 用 于 多 媒体 、 娱 乐 、 即 时 3D 
动画 等 广泛 和 实用 的 3D 图 形 计 算 领 域 。 





本 书 围 绕 交 互 式 计 算 机 图 形 学 这 一 主题 展开 ， 关 重 介绍 Direct3D 的 
基础 知识 和 着 色 器 编程 的 方法 ， 并 介绍 了 如 何 利用 Direct3D 来 实现 各 种 
有 趣 的 技术 与 特效 ， 旨 在 为 读者 学 习 更 高 级 的 图 形 技术 页 定 坚 实 的 基 
础 。 本 书包 括 3 部 分 内 容 。 第 一 部 分 介绍 必 备 的 数学 知识 ， 涵 瘟 同 量 代 
数 、 和 矩阵 代数 和 变换 等 内 容 。 这 是 贯穿 全 书 的 数学 工具 ， 是 读者 需要 党 
握 的 基础 内 容 。 第 二 部 分 重点 介绍 Direct3D 的 基础 知识 ， 展 示 用 
Direct3D 来 实现 绘图 任务 的 基本 概念 与 技术 ， 如 泻 染 流水 线 、 纹 理 贴 
图 、 混 合 、 曲 面 细 分 等 。 第 三 部 分 则 利用 Direct3D 来 实现 各 种 有 趣 的 特 
效 ， 如 实例 化 与 视 锥 体 剔 除 、 阴 影 贴 图 、 环 境 光 放 珊 等 。 








本 书 适合 希望 通过 Direct3D 来 学 习 3D 编 程 的 C++ 中 级 程序 员 阅 读 ， 
也 可 供 已 对 Direct3D 有 一 定 了 解 或 具有 非 DirectX API 使 用 经 验 的 3D 程 序 
员 参 考 。 

说 以 此 书 献 给 我 的 侄 奉 们 一 一 


Marrick、Hans、Max、Anna、Augustus、Presley 以 及 Elyse 


— 记 = 


且 百 





Direct3D 12 是 一 于 为 运行 在 现代 图 形 人 硬件 上 的 各 种 Windows 10 平 台 
CWindows 桌 面 版 、 手 机 版 和 Xbox One) 编写 高 性 能 3D 图 形 应 用 程序 的 
演 染 库 。Direct3D 也 是 一 种 底层 库 ， 这 也 就 意味 着 此 种 应 用 程序 接口 
(API) 与 其 下 层 控制 的 图 形 硬 件 模块 关系 更 为 紧密 [。Direct3D 的 主 
要 用 户 大 多 来 自 游 戏 产业 ， 他 们 要 驭 Direct3D 来 构建 更 加 高 端的 演 染 引 
擎 。 同 时 ， 它 亦 应 用 于 如 医药 产业 、 科 学 可 视 化 以 及 虚拟 建筑 漫游 等 行 
业 ， 用 来 实现 高 性 能 的 3D 图 形 交 互 功 能 。 男 外 ， 由 于 当今 每 一 部 新 的 
个 人 电脑 都 已 配备 了 现代 图 形 设备 ， 因 此 ， 非 3D 应 用 也 开始 逐步 把 计 
算 密 集 型 的 工作 移交 至 显卡 来 执行 ， 以 充分 友 挥 其 中 GPU (Graphics 
Processing Unit， 图 形 处 理 器 的 计算 能 力 。 这 就 是 众所周知 的 GPU 通 
用 计算 (general purpose GPU computing) 技术 。 对 此 ，Direct3D 也 提供 
了 用 于 编写 GPU 通用 计算 程序 的 计算 着 色 器 API。 尽 管 Direct3D 12 程 序 
通常 以 原生 的 C++ 语言 进行 编写 ， 但 SharpDX 团 队 正 在 致力 于 .NET 包 装 
器 版 的 开发 ， 因 此 ， 用 户 也 可 以 从 托管 应 用 程序 中 来 访问 这 一 强大 的 
3D 图 形 API。 




















本 书 围绕 交互 式 计算 机 图 形 学 这 个 主题 展开 ， 关 注 于 通过 Direct3D 
12 来 进行 游戏 的 开发 。 读 者 将 从 中 学 到 Direct3D 的 基础 知识 以 及 着 色 器 
编程 的 方法 。 阅 读 完 本 书 之 后 ， 读 者 束 可 以 继续 学 习 更 加 高 级 的 图 形 技 
术 了 。 本 书 共 分 为 3 个 主要 部 分 。 第 一 部 分 讲解 了 本 书后 续 要 用 到 的 数 


学 知识 。 第 二 部 分 展示 如 何 用 Direct3D 来 实现 基本 绘图 任务 ， 例 如 初始 
化 Direct3D， 定 义 3D 儿 何 图 形 ， 设 置 摄像 机 ， 光 照 ， 纹 理 ， 混 合 技术 ， 

模板 技术 ， 曲 面 细 分 技术 ， 创 建 项 点 、 像 素 、 几 何 图 形 以 及 计算 着 色 

器 。 第 三 部 分 则 主要 是 利用 Direct3D 来 实现 各 种 有 趣 的 技术 与 特效 ， 例 
如 动画 角色 网 格 、 拾 取 技术 、 环 境 贴图 、 法 线 贴图 、 阴 影 贴图 以 及 环境 
光 遮 向 技术 。 





初学 者 最 好 按 移 后 顺序 通读 全 书 。 书 中 章节 是 按照 由 浅 入 深 、 逐 步 
递 进 的 顺序 组 织 而 成 的 。 这 样 一 来 ， 读 者 便 不 会 因 过 陡 的 学 习 曲 线 而 如 
堕 烟 海 。 一 般 来 讲 ， 特 定 篇 章 中 所 用 的 技术 与 概念 往往 在 之 前 的 革 市 中 
有 所 交代 。 因 此 ， 读 者 最 好 在 掌握 了 欲 学 习 章 节 之 前 的 所 有 内 容 后 再 继 
续 前 行 。 当 然 ， 有 一 定 经 验 的 读者 可 直接 挑选 感 兴趣 的 部 分 进行 阅读 。 





最 后 ， 部 分 读者 可 能 会 不 禁 琢 磨 : 读 完 本 书 之 后 ， 完 竟 能 够 开发 出 
何 种 类 型 的 游戏 来 呢 ? 这 里 对 此 给 出 的 解释 是 : 您 最 好 亲自 粗略 地 阅览 
此 书 ， 看 看 其 中 大 概 痢 在 讲 些 什 么 内 容 。 据 此 ， 基 于 本 书 所 讲 的 技术 知 
识 再 结合 目 己 的 聪明 才智 ， 至 于 能 够 开发 出 哪 类 游戏 作品 ， 想 必 这 答案 
读者 也 融和 目 会 了 然 于 胸 了 。 





本 书 受 众 
本 书 主要 适合 以 下 3 类 读者 ; 


1. 布 望 通 过 Direct3D 了 最 新 版 本 来 学 习 3D 图 形 学 编程 的 C++ 中 级 程 


3 


5 


2. 具有 非 DirectX API〈( 如 OpenGL) 使 用 经 验 ， 并 希望 学 习 
Direct3D 编 程 方面 知识 的 3D 程 序 员 。 


3. 具有 一 定 的 Direct3D 使 用 经 验 ， 并 希望 学 习 Direct3D 最 新 版 本 的 


预备 知识 





需要 强调 的 是 ， 本 书 为 重点 介绍 Direct3D 12、 着 色 器 编程 以 及 3D 游 
戏 编程 的 读物 ， 而 并 非 是 讨论 一 般 计 算 机 程序 设计 的 读物 。 因 此 ， 读 者 
需要 具备 下 列 预备 知识 : 


1. 高 中 程度 的 数学 知识 ， 比 如 代数 、 三 角 学 以 及 《数学 ) 函数 


等 。 


2. Visual Studio 相 关 的 使 用 技能 ， 比 如 如 何 创建 项 目 、 为 项 目 添 加 
文件 以 及 指定 需要 链接 的 外 部 库 等 。 


3. 中 级 C++ 编程 技能 以 及 数据 结构 知识 ， 比 如 熟练 地 运用 指针 、 
数组 、 运 算 符 重 载 、 链 表 、 继 承 、 多 态 等 。 





4. 熟悉 使 用 Win32 API 进 行 Windows 编 程 还 是 很 有 必要 的 ， 可 谓 是 
学 习 本 书 的 基础 。 但 这 一 条 并 非 是 强制 性 要 求 ， 因 为 本 书 附录 A 中 提供 
了 Win32 编 程 的 相关 入 门 知 识 。 





需要 配备 的 开发 工具 以 及 硬件 环境 
下 面 是 进行 Direct3D 12 编 程 的 必 备 条 件 : 
1. Windows 10 操 作 系 统 。 


2. Visual Studio 2015 开 发 环境 或 其 后 续 版 本 。 


.一 亚 文 持 Direct3D 12 的 显卡 《本 书 中 的 演示 程序 都 已 通过 


Geforce GTX 760 平 台 的 测试 ) 。 


使 用 DirectX SDK 文 档 以 及 SDK 示 例 








Direct3D 是 一 种 规模 庞大 的 API， 将 其 所 有 的 细 市 都 在 一 本 书 中 体 
现 是 不 切实 际 的 。 因 此 ， 为 了 获得 更 为 深入 的 API 人 信息， 学 习 DirectX 
SDKD] 文 档 的 查阅 方法 势 在 必 行 。DirectX SDK 在 MSDN 上 的 最 新 文档 
为 《Direct3D 12 Programming Guide》， 即 《Direct3D 12 编 程 指南 》 。 











图 1 所 示 的 是 在 线 文档 的 截图 。 


DirectX 文 档 涵盖 了 DirectX API 的 方方面面 ， 因 此 ， 它 是 一 种 不 可 
或 缺 的 参考 资料 。 然 而 ， 由 于 此 文档 对 预备 知识 的 讲解 并 不 深入 且 假 设 
读者 对 此 有 一 定 认识 ， 因 而 导致 它 无 法 成 为 初学 者 最 佳 的 学 习 工 具 。 但 
是 ， 随 着 DirectX 每 个 新 版 本 的 发 布 ， 该 文档 也 在 日 益 完 善 中 。 











换言之 ， 这 个 文档 主要 还 是 用 作 参 考 。 假 设 用 户 碰 到 一 个 与 
DirectX 有 关 的 数据 类 型 或 函数 ， 如 也 
数 ID3D12Device::CreateCommittedResource， 并 希望 获取 更 多 与 
之 相关 的 信息 ， 束 可 以 方便 地 在 该 文档 中 搜索 它 ， 比 如 本 示例 中 的 函数 
《 见 图 2) ， 以 得 到 更 为 细致 的 描述 。 
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图 1 DirectX 文 档 中 的 《Direct3D 12 编 程 指 南 》 
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CreateComputepipelineState entire resource and the resource is mapped to the heap. 
CreateConstantBufferview Syntax 
CreateDepthstenciview 
CreateDescriptorHeap HRESULT CreateCommittedResource( 

[in] <onst D3D12 HEAP_PROPERTIES *pHeapProperties， 
Createfence D3D12_HEAP_FLAGS HeapF lags, 

[in] const D3D12_RESOURCE_DESC  "pResourceDesc, 
CreateGraphucspipelineState D3D12_RESOURCE_STATES InitialResourceState, 

[in, optional] const D3D12_CLEAR_VALUE 
CreateHeap *poptimizedClearValue, 

REFIID riidResource, 
Grealtpincsdnesource [out, optional] void "sppvResource 
); 

CreateQueryHeap 
CreateRenderTargetView Parameters 
CreateReservedResource PHeapProperties [m] 

Type: const D3D12.HEAP_PROPERTIES” 
Caenoorsignsture A pointer to a D3D12_HEAP_PROPERTIES structure that provides properties for the 

resource's heap. 
Createsampler 

HeapFlags 

CreateshaderResourceview Type D3D12_HEAP_FLAGS 
ee Heap options as a bitwise-OR'd combination of D3D12_HEAP_FLAGS enumeration 

Constants. 
CreateUnorderedAccessView phesourceDesc fin] v 











图 2 获取 函数 的 相关 文档 


注意 “New 





在 本 书 中 ， 我 们 会 不 时 地 指导 读者 去 阅览 文档 以 获取 更 多 的 有 关 细 


I 


我 们 还 建议 读者 研究 一 下 官方 提供 的 Direct3D 12 演 示 程 序 。 


微软 官方 可 能 还 会 在 此 陆续 增添 更 多 的 例 程 。 除 此 之 外 ， 读 者 还 可 
以 去 NVIDIA、AMD 以 及 Intel 的 官方 网 站 上 查找 与 Direct3D 12 有 关 的 示 
例 。 


明确 学 习 目 的 


尽管 我 们 努力 遵循 Direct3D 12 的 最 佳 实践 ， 力 图 写 出 高 效 的 代码 ， 
但 本 书 中 每 个 样 例 的 主要 目标 还 是 为 了 阐述 Direct3D 中 的 基本 概念 以 及 
演示 图 形 编程 技术 。 应 当 明 确 的 是 ， 写 出 最 优 代 码 并 非 本 书 最 终 目的 ， 
而 且 过 分 优化 还 可 能 导致 原本 意图 明晰 的 代码 变 得 含混 不 清 ， 反 而 适 得 
其 反 。 和 希望 读者 将 这 一 点 铭记 于 心 ， 尤 其 是 在 将 书 中 例 程 代码 合并 到 自 
己 的 项 目 中 时 ， 因 此 在 此 过 程 中 ， 您 可 能 为 了 追求 程序 更 高 的 效率 而 重 
构 代 码 。 再 者 ， 为 了 把 注意 力 集 中 在 Direct3D API 上 ， 我 们 还 在 
Direct3D 之 上 构建 了 一 层 轻 量 级 的 框架 。 这 就 意味 着 我 们 很 可 能 会 在 源 
代码 中 ， 以 便 编码 的 数值 与 定义 其 他 内 容 的 方式 来 令 程序 得 以 运行 。 类 
似 地 ， 在 大 型 的 3D 应 用 程序 中 ， 可 能 要 在 Direct3D 的 基础 之 上 实现 一 球 
演 染 引擎 。 但 本 书 的 主 则 却 是 Direct3D API， 而 非 设 计 泻 染 引擎 。 























例 程 与 在 线 补充 材料 


读者 可 以 登录 本 书 的 网 站 (www.d3dcoder.net 和 
www.merclearning.com) ， 以 获取 本 书 相 关 材 料 。 在 前 者 中 ， 读 者 可 以 
找到 本 书 内 所 有 例 程 的 完整 源 代码 以 及 项 目 文件 。 也 可 通过 异步 社区 本 
书页 面 获取 (www.epubit.com) 。 在 大 多 数 情况 下 ，DirectX 程 序 往往 比 
较 庞 大 ， 以 至 于 不 宜 全 部 列 入 书 中 。 因 此 ， 只 得 在 书 中 先入 与 所 讲 内 容 
密切 相关 的 代码 片段 。 为 此 ， 我 们 极力 建议 读者 在 学 习 相关 的 例 程 代码 
时 去 一 睹 它 的 全 貌 ( 为 了 便于 读者 学 习 ， 我 们 已 将 演示 程序 的 规模 评 量 
减 小 ) 。 一 般 说 来 ， 在 阅读 过 特定 章节 ， 并 研究 完 所 附 演示 代码 后 ， 读 
者 应 当 能 够 自行 独立 地 实现 该 章节 中 所 述 的 例 程 。 但 事实 上 ， 一 种 更 快 
捷 的 学 习 方 法 是 在 参考 书籍 和 示例 代码 的 同时 ， 尝 试 着 以 自己 的 方式 实 
现 相关 程序 。 











通过 Visual Studio 2015 安 装 演示 项 目 呈 | 





通过 双击 项 目 文件 〈.vcxproj ) 或 解决 方案 文件 〈.sln) 就 可 以 方便 
地 打开 本 书 的 演示 程序 。 接 下 来 ， 我 们 将 详 述 如 何 通 过 Visual Studio 
2015 (VS15) 以 本 书 的 例 程 框架 从 头 开 始 创 建 并 构建 一 个 项 目 。 在 此 ， 我 
们 以 第 6 章 中 的 “Box”( 立 方 体 ) 演示 程序 为 例 。 


下 载 本 市 的 源 代 但 





首先 ， 读 者 需要 下 载 本 书 所 用 的 源 代 码 并 将 其 保存 在 硬盘 的 某 个 文 
件 夹 之 中 。 为 了 便于 讨论 ， 假 设 这 个 文件 夹 的 路 径 为 Cd3dl2book。 在 
这 里 可 以 看 到 一 系列 文件 玉 ， 其 中 含有 对 应 半 市 的 例 程 项 目 。 读 者 可 能 
会 注意 到 有 个 名 为 “Common” 的 文件 来， 其 中 包含 所 有 演示 项 目 中 都 要 
复 用 的 公共 代码 。 现 在 便 可 以 在 源 代码 文件 夹 中 新 建 一 个 文件 来， 用 来 
存放 我 们 自己 的 例 程 ， 例 如 C:\d3d12bookWIMyDemos。 随 后 ， 我 们 将 基 
于 本 书 中 的 例 程 框架 在 该 文件 夹 中 创建 一 个 新 的 项 目 。 





事实 上 ， 读 者 自己 设置 的 目录 结构 大 可 不 必 如 此 ， 这 只 不 过 是 本 书 
例 程 的 结构 而 已 。 如 果 读 者 希望 按 上 自己 的 意愿 来 设置 源 代码 文件 ， 可 以 
将 演示 项 目 放 在 任何 地 方 ， 只 要 使 Visual Studio 能 找到 Common 目录 中 的 


源 代码 即 可 。 


创建 一 个 Win32 项 目 





首先 运行 VS15， 接 着 在 主 沫 单 中 依次 选择 File〈 文 件 ) ,New 新 
建 ) ~ 了 Project〈 了 项目) ， 如 图 3 所 示 。 





Start Page - Microsoft Visual Studio 


File Edit View Debug Team Data Tools Test Window Help 


New » | 团 Project.. Ctrl+Shift+N 
Open ，| 六 Web Site.. Shift+Alt+N 
Close 太 Team Project.. 


DD File.. Ctrl+N 
Project From Existing Code... 


图 3 创建 一 个 新 项 目 


在 弹出 的 New Project( 新 项 目 ) 对 话 框 〈 如 图 4 所 示 ) 左 侧 Visual 
C++ 项 目 类 型 的 树 形 控件 中 选择 Visual C++ Win32， 再 于 右 侧 选择 
Win32 Project (Win32 项 目 ) 。 接 下 来 ， 给 项 目 起 个 名 称 ， 并 指定 项 目 
文件 夹 的 保存 位 置 。 别 筷 了 取消 默认 选中 的 Create directory for 
solution (为 解决 方案 创建 目录 ) 复 选 框 。 随 后 单 击 OK 确定 ) 按钮 。 





接着 ， 义 会 弹出 一 个 新 的 对 话 框 。 其 左 侧 有 Overview〔 概 述 ) 和 
Application Settings (应 用 程序 设置 ) 两 个 选项 。 选 择 Application 
Settings， 便 会 出 现 如 图 5 所 示 的 对 话 框 。 在 这 里 ， 需 要 确保 选择 
Windows application (Windows 应 用 程序 ) 选项 和 Empty project( 空 项 
目 〉 复 选 杠 ， 之 后 再 单 击 Finish〈 完 成) 按钮 。 人 至 此 ， 我 们 已 成 功 创建 





了 一 个 空 的 Win32 项 目 ， 


事情 需要 做 。 


MyD3DProject 


+ 
画 Win32 Console Application 


C\d3d12bool\ MyDemos 


但 在 构建 DirectX 项 目 例 程 之 前 ， 


NET Framework 4.52 ~ Sortby: Default 


Visual C++ Type: Visual C+* 


+ 
区] wazprjec 


A project for cresting a Win32 application, 
console application, DLL, or static library 


9 FT | 
口 Gueste directory for solution 
DO Add to source control 











图 4 新 项 目的 相关 设置 
Win32 Application Wizard - MyD3D11Project i 1 


Overview 


ApPlcanon sedngs 





链接 DirectX 库 


[| 
a Application Settings 


图 5 


Application type: Add common hesder files for: 
® Windows application 

Console opplication 

pm 

Static library 
Additional options: 


可 Empty project 











应 用 程序 的 相关 设置 


arch Installed Templates (Ct+E ~ 


我 们 


通过 在 源 代码 文件 Common/d3dApp.h 中 使 用 #pragma 预 处 理 指 令 来 


链接 所 需 的 库 文件 ， 如 : 


// 链接 所 需 的 d3d12 库 
#pragma comment(1lib, "d3dcompiler.1ib") 


#pragma comment(1ib, "D3D12.1ib") 
#pragma comment(lib, "dxgi.1ib") 





对 于 创建 演示 程序 而 言 ， 该 预 处 理 指 令 使 我 们 免 于 打开 项 目 属性 页 
面 并 在 连接 器 配置 项 下 指定 附加 依赖 库 。 


洪 加 源 代 人 码 并 构建 项 目 


至 此 ， 项 目 己 经 配置 完成 。 现 在 来 为 它 添 加 源 代 码 并 对 其 进行 构 
建 。 首 先 ， 将 “Box” 充 示 程 序 的 源 代 码 BoxApp.cpp 以 及 Shaders 文 件 夹 
(位 于 d3d12book\Chapter 6 Drawing in Direct3D\Box) 复制 到 工程 目录 
过 有 < 
竺 复制 完 上 述 文件 之 后 ， 我 们 以 下 列 步 骤 来 将 源 代 人 码 添 加 到 当前 的 
项 目 之 中 。 


1.， 碳 键 单 击 解决 方案 资源 管理 器 下 的 项 目 名 称 ， 在 弹出 的 下 拉 来 
单 中 依次 选择 Add (添加 )〉) ~ Existing Item ( 现 有 项 ) ， 将 文件 
BoxApp.cpp 添 加 到 项 目 中 。 


2. 石 键 单 击 解雇 方案 资源 管理 器 下 的 项 目 名 称 ， 在 弹出 的 下 拉 沫 
单 中 逐步 选择 Add -Existing Item， 前 往 读者 放置 本 书 Common 文 件 夹 
的 位 置 ， 并 将 此 文件 夹 中 所 有 的 .hy.cpp 文 件 都 添加 到 项 目 之 中 。 现 在 ， 





方案 资源 定理 器 看 起 来 应 当 与 图 6 相同 。 


3. 再 次 右键 单 击 解决 方案 资源 管理 器 下 的 项 目 名 称 ， 从 琳 单 中 选 
择 Properties (属性 ) 。 再 从 Configuration Properties (配置 属性 ) 
General (常规 ) 选项 卡 下 ， 将 Target Platform Version 〈 目标 平台 版 
本 ) 设置 为 版 本 10.x 四 ， 以 令 目 标 平 台 为 Windows 10。 接 着 单 击 
Apply 应用) 按钮 。 








4. 大功告成 ! 源 代码 文件 现 都 已 位 于 项 目 之 中 ， 读 者 可 以 在 主 荣 
单 中 选择 Debug (调试 ) ~> Start Debugging (开始 调试 ) 进行 编译 、 链 
接 以 及 执行 该 演示 程序 。 应 用 程序 的 执行 效果 应 当 与 图 7 所 示 的 一 致 。 


Solution Explorer 
全 | ©- 与 宣 屿 | 一 
Search Solution Explorer (Ctrl+ 
网 Solution 'MyD3D12project' (1 project) 
4 是 MyD3D12Project 
此 External Dependencies 
4 元 | Header Files 
Camera.h 


d3dApp.h 


b 
》 d3dUtil.h 
b d3dx12.h 
b DDSTextureLoader.h 
b MM GameTimerh 
GeometryGenerator.h 
Db MathHelper.h 
b UploadBuffer.h 
b wa References 
Resource Files 
4 | Source Files 
b +*+ BoxApp.cpp 
++ Camera.cpp 
+ d3dApp.cpp 
*+ d3dUtil.cpp 
++ DDSTextureLoader.cpp 
++ GameTimer.cpp 
++ GeometryGenerator.cpp 
++ MathHelper.cpp 


Solution Explorer 关上 TFT 





图 6 ”添加 “Box” 例 程 所 需 源 代码 之 后 的 解决 方案 资源 管理 器 





DD d3d App fps 60.000000 mspf 16.666566 





图 7 “Box” 演 示 程 序 的 效果 


注意 As 


Common 目 录 下 的 大 量 代码 都 是 构建 本 书 例 程 的 基石 。 所 以 ， 建 议 
读者 先 不 必 忙于 查看 这 些 代码 。 待 读 到 了 本 书 中 与 之 相关 的 章节 后 ， 再 
研究 它们 也 不 迟 。 











[1] 尤其 是 到 了 Direct3D 12， 更 像 Mantle 等 API 那 样 实现 了 前 所 未 有 的 
更 底层 的 硬件 抽象 ， 削 减 驱 动 层 的 工作 ， 转 交 给 开发 者 负责 ， 从 而 令 图 
形 的 处 理 流程 更 加 “智能 使 用 起 来 犹如 贴 地 飞行 的 “快感 ”。 


[2] _ DirectX 包罗 系列 与 多 媒体 以 及 游戏 开发 有 关 的 API， 因 此 Direct3D 
只 是 DirectX 的 一 个 子 集 。 详 细 信息 请 见 《DirectX Graphics and 
Graming》 (ee663274) 。 本 书 则 侧重 Direct3D 的 讲解 。 


[3] 采用 Visual Studio 2017 的 读者 可 以 参考 《Visual Studio 中 的 使 用 
C++ 的 DirectX 游 戏 开 及 》 一 文 





[4] 其 中 的 “x” 对 应 于 构建 项 目 时 所 采用 的 具体 SDK 版 本 。 





资源 与 文 持 


本 书 由 异步 社区 出 品 ， 社 区 (https://www.epubit.com/)〉 为 您 提供 相 
关 资 源 和 后 续 服务 。 


配套 资源 
本 书 提供 如 下 资源 : 
。 本 书 配套 源 代码 ; 


练习 媒体 系 材 ; 


书 中 图 片 资源 。 





要 获得 以 上 配套 资源 ， 请 在 异步 社区 本 书页 面 中 点 击 和 汪汪 ， 中 
转 到 下 载 界 面 ， 按 提示 进行 操作 即 可 。 注 意 : 为 保证 购书 读者 的 权益 ， 
该 操作 会 给 出 相关 提示 ， 要 求 输入 提取 码 进行 验证 。 





如 果 您 是 教师 ， 和 希望 获得 教学 配套 资源 ， 请 在 社区 本 书页 面 中 直接 
联系 本 书 的 贡 任 编辑 。 





提交 勘误 





作者 和 编辑 尽 最 大 努力 来 确保 书 中 内 容 的 准确 性 ， 但 难免 会 存在 下 
漏 。 欢 迎 您 将 友 现 的 问题 反馈 给 我 们 ， 帮 助 我 们 提升 图 书 的 质量 。 


当 您 发 现 错误 时 ， 请 登录 异步 社区 ， 按 书 名 搜索 ， 进 入 本 书页 面 ， 
点 击 “ 提 区 勘误 ”， 输 入 勘误 信息 ， 点 击 “ 提 区 ?按钮 即 可 。 本 书 的 作者 和 
编辑 会 对 您 提交 的 勘误 进行 审核 ， 确 认 并 接受 后 ， 您 将 获 赠 寞 步 社区 的 
100 积 分 。 积 分 可 用 于 在 异步 社区 部 换 优 囊 券 、 样 书 或 奖品 。 




















与 我 们 联系 

我 们 的 联系 邮箱 是 contact@epubit.com.cn。 

如 果 您 对 本 书 有 任何 疑问 或 建议 ， 请 您 发 邮件 给 我 们 ， 并 请 在 邮件 
标题 中 注 明 本 书 书 名 ， 以 便 我 们 更 高 效 地 做 出 反馈 。 


如 果 您 有 兴趣 出 版 图 书 、 录 制 教学 视频 ， 或 者 参与 图 书 翻译 、 技 术 
审 校 等 工作 ， 可 以 发 邮件 给 我 们 ， 有意 出 版 图 书 的 作者 也 可 以 到 异步 社 
区 在 线 提交 投稿 《直接 访问 www.epubit.com/selfpublish/submission 即 
本 





如 果 您 是 学 校 、 培 训 机 构 或 企业 ， 想 批量 购买 本 书 或 异步 社区 出 版 
的 其 他 图 书 ， 也 可 以 发 邮件 给 我 们 。 


如 果 您 在 网 上 发 现 有 针对 异步 社区 出 品 图 书 的 各 种 形式 的 盗版 行 
为 ， 包 括 对 图 书 全 部 或 部 分 内 容 的 非 授权 传播 ， 请 您 将 怀疑 有 侵权 行为 
的 链接 发 邮件 给 我 们 。 您 的 这 一 举动 是 对 作者 权益 的 保护 ， 也 是 我 们 持 
续 为 您 提供 有 价值 的 内 容 的 动力 之 源 。 








天 于 开 步 社区 和 有 异步 图 书 


“ 寞 步 社区 ”是 人 民 邮 电 出 版 社 旗下 IT 专 业 图 书社 区 ， 致 力 于 出 版 精 
品 IT 拉 术 图 书 和 相关 学 习 产 品 ， 为 作 译 者 提供 优质 出 版 服务 。 寞 步 社区 
创办 于 2015 年 8 月 ， 提 供 大 量 精品 IT 技 术 图 书 和 电子 书 ， 以 及 高 品质 技 
术 文 章 和 视频 谍 程 。 更 多 详情 请 访问 异步 社区 官网 


https:/www.epubit.com 。 








“异步 图 书 ” 是 由 异步 社区 编辑 团队 集 划 出 版 的 精品 开 专 业 图 书 的 品 
牌 ， 依 托 于 人 民 邮 电 出 版 社 近 30 年 的 计算 机 图 书 出 版 积累 和 专业 编辑 团 
队 ， 相 关 图 书 在 封面 上 印 有 异步 图 书 的 LOGO。 腊 步 图 书 的 出 版 领域 包 
括 软件 开发 、 大 数据 、AI、 测 试 、 前 端 ”、 网 络 技术 等 。 





异步 社区 





臻 谢 


在 此 ， 我 要 对 审阅 本 书 早期 版 本 的 Rod Lopez、Jim Leiterman、 
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和 


第 一 部 分 必 备 的 数学 知识 


“世上 之 事 ， 无 数学 则 不 可 解 。” 


罗 杰 * 培 根 (《 大 和 著作》 第 四 部 分 ， 第 一 章 《 第 一 个 区 别 》，1267 年 ) 





电子 游戏 试图 同 玩 家 呈现 出 一 个 虚拟 的 世界 。 然 而 ， 计 算 机 从 本 质 
上 来 讲 却 是 一 种 处 理 数据 的 精密 仪 右 。 那 么 问题 来 了 : 如 何 用 计算 机 来 
表达 游戏 中 虚拟 的 场景 呢 ? 解决 的 办 法 就 是 完全 运用 数学 的 方式 来 描述 
场景 空间 以 及 其 中 物体 的 交互 。 因 此 ， 数 学 在 电子 游戏 的 开发 中 起 着 至 
关 重 要 的 基础 性 作用 。 


在 讲述 必 备 知识 的 第 一 部 分 中 ， 我 们 将 介绍 罕 插 于 全 书 的 数学 工 
具 。 重 点 是 疝 量 (vector， 物 理学 和 工程 学 中 亦 常 译 为 “矢量 ”)、 坐 标 系 
(coordinate System ) 、 和 矩阵 (matrix) 及 其 变换 (transformation) ， 这 
些 工具 将 广泛 用 于 本 书 的 所 有 例 程 之 中 。 除 了 对 这 些 数 学 知识 进行 讲解 
以 外 ， 我 们 还 将 纵 虎 由 DirectX 数 学 库 所 提供 的 相关 类 与 函数 ， 并 示范 
忆 们 的 用 法 











请 注意 ， 这 些 主题 仪 论述 了 本 书后 续 需 要 掌握 的 一 些 基 础 内 容 ， 而 
有 关 电 子 游戏 所 需 的 数学 知识 却 不 止 于 此 。 对 于 期 望 学 习 更 多 与 游戏 相 
关 数 学 知识 的 读者 ， 我 们 推荐 [Verth04] 和 [Lengyel02]。 


第 1 章 “ 辐 量 代数 ”向 量 (vector〉 也 许 是 计算 机 游戏 中 最 基础 的 数学 





对 象 ， 没 有 之 一 了 。 例 如 ， 我 们 可 以 用 向 量 表示 位 置 、 位 移 、 方 向 、 速 
度 与 力 。 在 这 一 章 中 ， 我 们 将 学 习 问 量 及 其 运算 法 则 。 





第 2 半 “ 算 阵 人 代数” 矩阵 matrix) 为 变换 提供 了 一 种 高 效 且 紧凑 的 
简化 表达 方式 。 在 这 一 章 中 ， 我 们 将 熟悉 矩阵 及 其 运算 定义 。 


第 3 章 “* 变 换 ” 这 一 章 将 考察 缩放 、 旋 转 和 平移 这 三 种 基本 的 几何 变 
换 。 我 们 利用 这 些 变换 来 操纵 空间 中 的 3D 物 体 。 男 外 ， 我 们 还 将 讲解 
坐标 变换 ， 以 此 在 不 同 的 坐标 系 之 间 转 换 几 何 体 的 坐标 表示 。 


第 1 章 ” 问 量 代数 


回 量 在 计算 机 图 形 学 、 碰 撞 检 测 和 物理 模拟 中 扮演 着 关键 的 角色 ， 
而 这 儿 方 面 义 正 是 构成 现代 电子 游戏 的 常见 组 成 部 分 。 本 书 的 讲述 风格 
主要 趋 于 实践 而 非 严 格 化 的 数学 推理 ， 如 需要 查阅 专业 的 3D 游 戏 或 3D 
图 形 学 数学 书籍 ， 可 参考 [Verth04] 一 书 。 需 要 强调 的 是 ， 本 章 研 究 同 量 
的 主要 目的 在 于 使 读者 理解 本 书 中 所 有 例 程 里 向 量 的 用 法 。 








学 习 目 标 : 





1. 学 习 向 量 在 儿 何 学 和 数学 中 的 表示 方法 。 





2. 了 解 问 量 的 运算 定义 及 其 在 几何 学 中 的 应 用 。 





3. 熟悉 DirectXMath 库 中 与 回 量 有 关 的 类 和 方法 。 


1.1 问 量 


问 量 〈vector) 是 一 种 兼 具 大 小 《也 称 为 模 ，magnitude) 和 方 回 的 
量 。 有 具有 这 两 种 属性 的 量 皆 称 为 癌 量 值 物 理 量 〈vector-valued 
quantity) 。 与 向 量 值 物理 量 相 关 的 例子 有 作用 力 〈 在 特定 方向 上 施加 
的 力 一 一 力 的 大 小 即 为 向 量 的 模 ) 、 位 移 〈 质 点 沿 净 方向 山 移动 的 距 
离 ) 和 速度 《速率 和 方向 ) 。 这 样 一 来 ， 疝 量 就 能 用 于 表示 力 、 位 移 和 
速度 。 另 外 ， 有 时 也 用 回 量 单 指 方向 ， 例 如 玩家 在 3D 游 戏 里 的 视角 方 
癌 、 一 个 多 边 形 的 朝 辣 、 一 束 光 线 的 传播 方向 以 及 它 照 射 在 某 表 面 后 的 
反射 方 同等 。 





首先 用 几何 方法 来 描述 回 量 的 数学 特征 :通过 图 像 中 的 一 条 有 问 线 
段 即 可 表示 一 个 同 量 〈 见 图 1.1) ， 其 中 ， 线 段 长 度 代 表 问 量 的 模 ， 箭 
头 的 指向 代表 向 量 的 方 同 。 我 们 可 以 注意 到 : 回 量 的 绘制 位 置 之 于 其 目 
吴 是 无 足 轻重 的 ， 因 为 改变 茶 同 量 的 位 置 并 不 会 对 其 大 小 或 方 问 这 两 个 
属性 造成 任何 影响 。 因 此 ， 我 们 次 : 两 个 向 量 相 等 ， 当 且 仅 当 它 们 的 长 
度 相等 且 方 向 相同 。 所 以 ， 图 1.1a 中 的 向 量 w 和 同 量 v 相 等 ， 因 为 它们 的 
长 度 相 等 且 方 向 相同 。 事 实 上 ， 由 于 位 置 对 于 向 量 是 无 天 紧要 的 ， 所 以 
我 们 总 是 能 在 平移 一 个 同 量 的 同时 义 完 全 不 改变 它 的 几何 意义 《因为 平 
移 操作 既 不 影响 它 的 长 度 ， 也 不 改变 它 的 方向 ) 。 显 而 易 见 ， 我 们 可 以 
将 回 量 w 完 全 平移 到 癌 量 w 处 〈 反 之 亦 可 ) ， 使 两 者 完全 重合 ， 分 曼 不 兰 
一 一 由 此 即 可 证 明 它 们 是 相等 的 。 现 给 出 一 个 实例 ， 图 1.1b 中 的 向 量 w 
和 问 量 v 辐 两 只 昭 蚁 分 别 发 出 指示 : 令 它 们 从 各 上 自 所 处 的 两 个 不 同 皮 ，4 


















































扩 和 B 上 把， 癌 北 扑 行 10 米 。 这 样 一 来 ， 我 们 就 能 根据 蚂蚁 的 扑 行 路 线 ， 
再 次 得 到 两 个 相等 的 向 量 w = wv。 此 时 ， 这 两 个 向 量 与 位 置信 息 无 关 ， 
仅 简 日 地 指挥 蚂蚁 们 如 何 从 它们 所 处 的 位 置 息 行 移动 。 在 本 例 中 ， 曲 蚁 
们 被 指示 同 北 ( 方 同 ) 移动 10 米 《长 度 ) 。 








图 1.1 向 量 的 实例 
(a) 绘制 在 2D 平 面 上 的 向 量 ”(b)〉 这 两 个 向 量 指挥 蚂蚁 们 向 北 移动 10 米 








1.1.1 问 量 与 坐标 系 








现在 来 定义 疝 量 实用 的 几何 运算 ， 它 能 解决 与 向 量 值 物理 量 有 关 的 
问题 。 然 而 ， 由 于 计算 机 无 法 直接 处 理 以 几何 方法 表示 的 癌 量 ， 所 以 需 
要 寻求 一 种 用 数学 表示 疝 量 的 方法 加 以 代 丛 。 在 这 里 ， 我 们 引入 一 种 
3D 空 间 坐 标 系 ， 通 过 平移 操作 使 向 量 的 尾部 都 位 于 原点 〈 见 图 1.2〉。 
接着 ， 我 们 就 能 凭借 癌 量 头 部 的 坐标 来 确定 该 问 量 ， 并 将 它 记 作 
v 三 (7,y,?)， 如 图 1.3 所 示 。 现 在 就 能 以 计算 机 程序 中 的 3 个 浮 点 数 来 表 


未 一 个 问 量 了 。 




















图 1.2 平移 向 量 v， 使 它 的 尾部 与 坐标 系 的 原点 重合 。 当 一 个 向 量 的 尾部 位 于 原点 时 ， 称 该 问 
量 位 于 标准 位 置 (standard position) 


+Y 





图 1.3 ”一 个 向 量 在 某 3D 坐 标 系 中 的 坐标 


注 意 Note Wp 


如 果 在 2D 空 间 里 进行 开发 工作 ， 则 改 用 2D 坐 标 系 即 可 。 此 时 ， 回 
量 只 有 两 个 坐标 分 量 : v? = (7,YW)。 在 这 种 情况 下 ， 计 算 机 程序 中 仅 用 两 
个 浮 扣 数 残 能 表示 一 个 癌 量 。 








请 考虑 图 1.4， 该 图 展示 了 同 量 v 以 及 空间 中 两 组 不 同 的 标 染 
(frame) [站 。 我 们 可 以 平移 向 量 vs， 将 它 分 别 置 于 两 组 标 架 中 的 标准 位 
置 。 显 而 易 见 的 是 ， 癌 量 v 在 标 架 4 中 的 坐标 与 它 在 标 染 8 中 的 坐标 是 不 
同 的 。 换 句 话 说 ， 同 一 个 向 量 v 在 不 同 的 坐标 系 中 有 着 不 同 的 坐标 表 
示 5 











标 架 A 














图 1.4 同一 向 量 v 在 不 同 的 标 架 中 有 着 不 同 的 坐标 





与 此 类 似 的 还 有 温度 。 水 的 沸点 为 100'C 或 212°F (华氏 度 ) BI。 沸 
水 的 物理 温度 是 不 变 的 ， 与 过 标 无 关 《〈 也 就 是 说 ， 不 能 因为 采用 不 同 的 
温标 而 使 其 沸点 降低 ) ， 但 是 我 们 却 可 以 根据 所 用 的 温标 来 为 同一 进度 
赋予 不 同 的 标量 值 。 类 似 地 ， 对 于 同 量 来 说 ， 它 的 方向 和 模 都 表现 在 对 
应 的 有 回 线 段 上 ， 不 会 更 改 ;， 只 有 在 改变 描述 它 的 参考 系 时 ， 其 坐标 才 
会 相应 地 改变 。 这 一 点 是 很 重要 的 ， 因 为 这 意味 着 : 每 当 我 们 根据 坐标 
来 确定 一 个 向 量 时 ， 其 对 应 的 坐标 总 是 相对 于 茶 一 参考 系 而 言 的 。 在 
3D 计 算 机 图 形 学 中 ， 我 们 通 第 会 用 到 较 多 的 参考 系 。 因 此 ， 我 们 需要 
记录 向 量 在 每 一 种 坐标 系 中 的 对 应 坐标 。 另 外 ， 我 们 也 需要 知道 如 何 将 
问 量 坐标 在 不 同 的 标 架 之 间 进 行 转换 。 


























注 车 Note pp 


可 以 看 出 ， 标 架 中 的 向 量 和 点 都 能 够 用 坐标 (7,y, zj) 来 表示 。 但 是 它 
们 的 意义 却 是 截然 不 同 的 : 在 3D 空 间 中 ， 点 仪表 示 位 置 ， 而 癌 量 却 表 
示 着 大 小 与 方向 。 我 们 将 在 1.5 节 中 对 点 展开 进一步 的 讨论 。 








1.1.2 左手 坐标 系 与 右手 坐标 系 


Direct3D 采 用 的 是 左手 坐标 系 (left-handed coordinate system) 。 如 
末 我 们 伸 出 左手 ， 并 拢 手指 ， 假 设 它们 指 同 的 是 z 轴 的 正方 向 ， 再 弯曲 
四 指 指 癌 y 轴 的 正方 向 ， 则 最 后 伸 直 拇指 的 方向 大 约 就 是 z 轴 的 正方 
向 多。 图 1.5 详 细 展 示 了 左手 坐标 系 与 右手 坐标 系 (right-handed 


coordinate system 的 区 别 。 





现在 来 看 右手 坐标 系 。 如 宋 伸 出 右手 ， 并 拢 手指 ， 假 设 它 们 指 同 的 
征 z 轴 的 正方 向 ， 再 这 曲 四 指 指 同 y 轴 的 正方 向 ， 那 么 ， 最 后 伸 直 拇指 的 
方向 大 约 就 是 z 轴 的 正方 向 。 





+Y +Y 








图 1.5 图 的 左 侧 展示 的 是 左手 坐标 系 ， 可 以 看 出 其 中 的 :坐标 轴 正 方向 指向 本 书页 面 内 ; 图 的 
右 侧 展 示 的 是 右手 坐标 系 ， 其 :坐标 轴 正 方向 则 指向 页 面 外 











1.1.3 问 量 的 基本 运算 





现在 通过 坐标 来 表示 问 量 的 相等 、 加 法 运算 、 标 量 乘法 运算 和 减法 
运算 的 定义 。 对 于 这 4 种 定义 ， 设 有 向 量 * = (wz; Wy;4) 和 向 量 


v = (vz, Vy,1 ) 














， 两 个 回 量 相等 ， 当 且 仅 当 和 它们 的 对 应 分 量 分 别 相等 。 即 v = vw， 
当 且 仅 当 vz = Vr, Uy Uy, VU; = Vo 








2. 问 量 的 加 法 即 令 两 个 同 量 的 对 应 分 量 分 别 相 加 : 
二 9 二 (Uz 十 Vr,ty 十 Wy,u: 十 0:)。 注意 ， 只 有 同 维 的 向 量 之 间 才 可 以 进 
行 加 法 运算 。 





3. 问 量 可 以 与 标量 ( 即 实数 ) 相 乘 ， 所 得 到 的 结果 仍 是 一 个 癌 
。 例 如 ， 设 为 一 个 标量 ， 则 X24 = (kuz, kwy, ku:)。 这 种 运算 叫 作 标 量 
i (scalar multiplication) 。 


4. 问 量 减法 可 以 通过 向 量 加 法 和 标量 乘法 表示 ， 即 





4 一 1 一 人 十 (一 1.2) 一 公 十 |{ v) = {Us — Vy, Uy Uy, UU: 一 vs) 


设 向 量 w = (1,2,3),，% = (1,2,3)，w = (3,0, -2) 及 标量 5 ~ 2。 那 么 ， 


. 
9 


1. w+ w= (1,2,3)+ (3,0,—2) = (4,2,1) 





3. 1 一 1 一 业 十 (一 v) = {1,2,3)+{(—1,—2,—3) = (0,0,0)= 0 


4. kw = 2(3,0,—2) = (6,0,—4) 

第 三 组 运算 的 不 同 之 处 在 于 其 中 有 个 叫 作 零 癌 量 (zero-vector) 的 
特殊 同 量 ， 它 的 所 有 分 量 都 为 0， 可 直接 将 它 简 记 作 0。 
例 1. 2 


为 了 使 配 图 绘制 起 来 更 为 方便 ， 我 们 在 此 例 中 将 围绕 2D 向 量 进行 
讨论 。 其 计算 方式 与 3D 辣 量 的 方法 一 致 ， 只 不 过 2D 疝 量 少 了 一 个 分 量 
而 已 。 











1. ] 
比较 呢 ? 我 们 注意 到 ， 2”" “31。 绘 出 向 量 v 和 3”( 见 图 
1 
1.6a) ， 可 以 观察 到 ， 向 量 2 的 方向 与 向 量 w 正 好 相反 ， 并 且 长 度 是 向 


] 
1. 设 向 量 v = (2,1)， 那 么 该 如 何在 几何 学 的 角度 上 对 v 与 “2 进行 
1 








量 v 的 /2。 由 此 可 知 ， 把 一 个 向 量 的 系数 变 为 其 相反 数 ， 束 相当 于 在 几 
何 学 中 “翻转 ”此 疝 量 的 方 同 ， 而 且 对 向 量 进行 标量 乘法 即 为 对 其 长 度 进 
行 缩放 。 








2， 没 向 量 * (2 5， 一 (3)， 则 "+ = (3 下 。 图 16b 展 示 了 疝 
量 加 法 运算 的 几何 意义 ;把 向 量 w 进 行 平 移 ， 使 w 的 尾部 与 v 的 头 部 重 
合 。 此 时 ， 向 量 w 与 向 量 v 的 和 即 ， 以 v 的 尾部 为 起 点 、 以 平移 后 wu 的 头 部 
为 终点 所 作 的 向 量 (如果 令 向 量 u 的 位 置 保持 不 变 ， 平 移 向 量 v， 使 o 的 
尾部 与 u 的 头 部 重合 也 能 得 到 同样 的 结果 。 在 这 种 情况 下 ，w + v 的 和 就 
可 以 表示 为 以 w 的 尾部 为 起 点 、 以 平移 后 w 的 头 部 为 终点 所 作 的 向 量 ) 。 
可 以 看 出 ， 向 量 的 加 法 运算 与 物理 学 中 不 同 作 用 力 合成 合力 的 规则 是 一 
致 的 。 如 果 有 两 个 力 〈 两 个 向 量 ) 作用 在 同一 方向 上 ， 则 将 在 这 个 方向 
上 产生 更 大 的 合力 (更 长 的 向 量 ) ， 如 果 有 两 个 力 〈 两 个 向 量 ) 作用 于 
彼此 相反 的 方向 上 ， 那 么 便 会 产生 更 小 的 合力 (更 短 的 向 量 ) ， 如 图 
1.7 所 示 。 














= (=1;- 


3. 设 向 量 ” 2)， 图 1.6c 展 示 了 向 
量 减法 运算 的 几何 意义 。 从 本 质 上 讲 ，w 一 4 的 差 值 仍 是 一 个 向 量 ， 该 
癌 量 目 v 的 头 部 始 至 o 的 头 部 终 。 如 果 我 们 将 w 和 zu 看 作 两 个 点 ， 那 么 
v 一 得 到 的 是 一 个 从 点 u 指 同 点 w 的 癌 量 ;这 种 解释 方式 的 重点 在 于 使 
我 们 找 出 向 量 的 方向 。 同 时 ， 不 难看 出 ， 在 把 wu 与 v 看 作 点 的 时 候 ， 
v 一 也 的 长 度 也 就 是 “点 4 到 点 v 的 距离 ”。 





Ss wy 
= (2,3) 


,9 二 (1,2)， 则 ” 




















v= (2,1) 














—1/2v = (—1,—1/2) 


(a) (b) (c) 





图 1.6” 问 量 运算 的 几何 意义 
(a) 标量 乘法 的 几何 意义 ”(b) 向 量 加 法 的 几何 意义 ”《〈c) 向 量 减 法 的 几何 意义 





图 1.7 作用 在 球 上 的 两 个 作用 力 。 利 用 向 量 加 法 将 两 者 合成 为 一 个 合 





1.2 ”长 度 和 单位 向 量 


向 量 大 小 《〈 亦 称 为 模 ) 的 几何 意义 是 对 应 有 向 线段 的 长 度 ， 用 双 竖 
线 表 示 〔 例 如 |lul| 代 表 向 量 w 的 模 ) 。 现 给 出 向 量 w = (x,y, 2)， 我 们 希望 
用 代数 的 方法 计算 它 的 模 。3D 向 量 的 模 可 通过 运用 两 次 毕 达 哥 拉 斯 定 
理 b 得 出 ， 如 图 1.8 所 示 。 





图 1.8 运用 两 次 毕 达 哥 拉 斯 定理 便 能 得 出 3D 向 量 的 模 





首先 来 看 位 于 平面 zz 中 以 rz，: 为 直角 边 ， 以 为 斜 边 所 构成 的 直角 
三 角形 。 根 据 毕 达 哥 拉 斯 定理 ， 有 o = Vr? + 22?。 接 下 来 再 看 以 x，y 为 直 
角 边 ， 以 |lul| 为 斜 边 所 围 成 的 直角 三 角形 。 再 次 运用 毕 达 哥 拉 斯 定理 ， 
便 能 得 出 下 列 计算 向 量 模 的 公式 : 





nD i 
/9 DN /9 了 了 
2 村 2 三 人 于 人 寺 2 


a / | 
ull = VE+e = V+(v (1.1) 


在 某 些 情况 下 ， 我 们 并 不 关心 同 量 的 长 度 ， 仪 用 它 来 表示 方向 。 对 


此 ， 我 们 希望 使 该 向 量 的 长 度 为 1。 把 一 个 向 量 的 长 度 变 为 单位 长 度 称 
为 向 量 的 规范 化 虽 (normalizing) 处 理 。 有 具体 实现 方法 是 ， 将 向 量 的 每 











为 了 验证 公式 的 正确 性 ， 下 面 计算 忌 的 长 度 : 





)》 ) 


bi (而 ) ， ( 疝 ) ， (i) - en 


由 此 可 见 ， 记 确实 是 一 个 单位 同 量 (unit vector) 。 








例 1.3 


对 回 量 w = (-1 3, 4) 进 行规 范 化 处 理 。 我 们 能 求 出 
loll= VCD2+32+ 生 = V6 因此 ， 








| 本 一 ) 
TU 一 一 == = & 
vl V26’ V26’ V26 


为 了 验证 是 单位 向 量 ， 我 们 计算 其 长 度 : 


和 /3 a 4 \ V 1 9 .1_ /i 
v|| = 一 二 一 = 下 一 二 | 一 = 
V26 V26 V26 26 26 26 

















1.3 点 积 


点 积 (dot product， 亦 称 数 量 积 或 内 积 ) 是 一 种 计算 结果 为 标量 值 
的 问 量 乘法 运算 ， 因 此 有 了 时 也 称 为 标量 积 (scalar product) 。 设 问 量 
WU = (Uz, Uy, U: )， v = (Vz, Vy, vU:), 则 点 积 的 定义 为 ; 


1U 一 rr 十 人 Uy 下 UU: (1 3) 


y 








可 见 ， 点 积 就 是 同 量 间 对 应 分 量 的 乘积 之 和 。 


点 积 的 定义 并 没有 明显 地 体现 出 其 几何 意义 。 但 是 我 们 却 能 根据 余 
弦 定 理 (law of cosines， 参 见 练习 10) 找到 二 回 量 点 积 的 几何 关系 : 





由 .也 一 ul lvl cosd (1.4) 














其 中 ，6 是 同 量 wu 与 同 量 v 之 间 的 夹 角 ，0 < 9 < 7"， 如 图 1.9 所 示 。 式 
(1.4) 表明 ， 两 向 量 的 点 积 为 : 两 向 量 夹 角 的 余弦 值 乘 以 这 两 个 向 量 
的 模 。 特 别 地 ， 如 果 向 量 wx 和 向量 w 都 是 单位 向 量 ， 那 么 w :wv 就 等 于 两 向 
量 夹 角 的 余弦 值 ， 即 :wv = cos0。 

















< 辐 
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(a) (b) 

















图 1.9 ”图 a 中 ， 向 量 w 与 向 量 v 之 间 的 夹 角 9 是 一 个 锐角 ; 图 b 中 ， 向 量 U 与 向 量 v 之 间 的 夹 角 9 是 
一 个 钝 角 。 每 当 讨论 两 个 向 量 之 间 的 夹 角 时 ， 我 们 提 及 的 总 是 较 小 的 那个 角 ， 即 角 9 总 是 满足 


0<O<A 























式 《1.4) 给 出 了 一 些 有 用 的 后 积 儿 何 性 质 : 
1. 如 果 wu:v ==0， 那 么 wlv〈 即 两 个 向量 正 交 ) 。 


2. 如 果 uv > 0， 那 么 两 向 量 之 间 的 夹 角 9 小 于 90°( 即 两 向 量 间 的 
夹 角 为 一 锐角 ) 。 


3. 如果 wu < 0， 那 么 两 癌 量 之 间 的 夹 角 9 大 于 90"《 即 两 回 量 间 的 
夹 角 为 一 钝 角 ) 。 


“ 正 交 ”(orthogonal) 与 “年 直 ”(perpendicular) 实 为 同义词 。 


例 1.4 





设 向 量 w = (1,2,3),，v = (一 40 -JJ。 计 算 向 量 v 与 v 之 间 的 夹 角 。 


4 .1 一 (1 2 3).( 一 4 0. 一 1) = 一 4 一 3 一 一 7 











,29 


ll = V4 + + (1) 


现在 ， 运 用 式 (1.4) 得 到 9: 





WU 全 
cos0 一 一 
lull vl Vi4: V17 
0 = cos-! — 人 117 
V14.VI17 


例 1.5 


考虑 图 1.10。 给 出 向 量 v 和 早 位 疝 量 mn， 请 借助 点 积 公式 求 出 用 vn 
表示 同 量 P 的 公式 。 














图 1.10 辐 量 2 在 单位 向 量 妈 上 的 正 交 投影 (orthogonal projection ) 











首先 ， 观 峙 图 示 可 以 得 知 存 在 一 标量 上 &， 使 得 P = Am 而且， 因为 
我 们 假设 |m| = 1， 所 以 有 2 = Im = 居于 辣 | = | 上。 注意 ，k 可 能 是 
负 值 ， 当 上 且 仅 当 P 与 n 的 方向 相反 。 利 用 三 角 函 数 ， 我 们 有 = | cos4 
; 因此 ，P = 和 = (vicos9)n。 又 由 于 n 是 单位 向 量 ， 便 可 以 用 另 一 种 
方法 来 表示 : 














p= (lvlcoso)n = (vlcoso)n = (vl nl cos On = (vnn 





特别 是 这 里 证 明了 : 当 n 是 单位 同 量 时 ,k= wv:n， 顺 带 也 解释 了 在 








这 种 情况 下 vn 的 几何 意义 。 我 们 称 P 为 回 量 v 洲 在 同 量 n 上 的 正 交 投影 
(orthogonal projection ) ， 通 常 将 它 表 示 为 : 


有 一 pro] nl 了 ) 





如 果 将 v 看 作 是 一 个 力 ， 便 可 认为 P 是 力 v 在 方 同 n 上 的 分 力 。 同 
理 ， 向 量 w = perpn(v) ==v 一 了 是 作用 力 v 在 n 的 正 交 方 向 上 的 分 力 “ 这 就 
是 用 perpnv/) 来 表示 “垂直 ”的 原因 〉 。 观 察 到 
v 二 了 二 外 二 Projn(V)+perpn(v)， 这 就 是 说 ， 可 以 将 向 量 v 分 解 成 两 个 互 
相 正 交 的 向 量 p 与 w 之 和 。 











如 果 n 不 具有 单位 长 度 ， 就 先 对 它 进 行规 范 化 处 理 ， 使 之 成 为 单位 
向 量 。 通 过 把 向 量 n 痊 换 为 单位 向 量 |mwl|， 即 可 得 到 更 具 一 般 性 的 投影 


人 





oe n n (vn) 
P= pron(v)= | v- = re 
nl nl nl 
正 纪 化 


如 果 向 量 集 {v0,… ,vn-1} 中 的 每 个 向 量 都 是 互相 正 交 (集合 内 的 任 
一 问 量 都 与 集合 中 的 其 他 所 有 癌 量 相互 正 交 〉 且 丝 具 单位 长 上 度 ， 那 么 我 
们 就 称 此 集合 是 规范 正 交 (orthonormal) 的 。 有 时 我 们 会 接 到 一 个 近乎 
《但 并 不 完全 ) 规范 正 交 的 集合 。 这 时 ， 一 个 常见 的 工作 就 是 通过 正 交 
化 手段 ， 使 之 成 为 规范 正 交 集 。 人 例如， 我们 有 时 会 在 3D 计 算 机 图 形 学 
中 用 到 规范 正 交 集 ， 但 是 由 于 处 理 过 程 中 数值 精度 的 问题 ， 它 会 随 之 逐 








步 变 为 非 规 范 正 交 集 。 这 时 就 要 用 到 正 交 化 这 一 手段 了 。 我 们 下 面 将 主 
要 围绕 这 种 问题 的 2D 和 3D 人 情况 展开 探讨 《也 就 是 说 ， 集 合 内 只 有 2 个 或 
3 个 问 量 的 情况 ) 。 


先 来 考察 相对 简单 的 2D 情 况 吧 。 假 设 我 们 有 向 量 集合 tuo: v1}， 现 
欲 将 它 正 交 化 为 图 1.11 中 所 示 的 正 交 集 {wo, w1}。 首 先 设 wo = zwo， 通 过 
使 V1 减 去 它 在 wo 上 的 分 量 ( 投 影 ， 来 令 它 正 交 于 wo: 





( 人 1 ) 


1 = V1 — Projwol 


此 时 ， 我 们 便 得 到 了 一 个 元 素 互 相 正 交 的 向 量 集 合 {wo, w1}， 最 后 
一 步 是 构建 一 个 规范 正 交 集 ， 将 同 量 wo 和 ww! 规范 化 为 单位 问 量 即 可 。 


3D 情 况 与 2D 情 况 的 处 理 方法 相似 ， 但 是 步 又 更 多 。 假 设 有 向 量 集 
{v0,v1,v2}， 现 希望 将 它 正 交 化 为 下 交集 {wo0; w1, wz}， 过 程 如 图 1.12 所 
示 。 首 先 使 wo = vo， 通过 令 v1 减 去 它 在 wo 方向 上 的 分 量 ， 让 它 正 交 于 wo 





WwW]1 = V1 — Projywo( v1) 


— proj,s (V1) 
Vl 


Mn 一 yn 


图 1.11 2D 正 交 化 处 理 





二 






projy, (m1) vy 


+2Z 
Wi 


TF proj,, (15) 1 





图 1.12 ”3D 正 交 化 处 理 








接 下 来 ， 通 过 令 v2 依 次 减 去 它 在 wo 方向 与 w! 方 向 上 的 分 量 ( 投 
影 ”》， 使 之 同时 正 交 于 wo、wi:; 


Wo = v2 — projy (v2) 一 Drojw (v2) 


现在 我 们 就 得 到 了 所 有 元 素 都 彼此 正 交 的 向 量 集 {wo, w1, wz 上 最 后 
一 步 是 通过 将 wo、w1 和 wz 规范 化 为 单位 向 量 来 构建 一 个 规范 正 交 集 。 








对 于 具有 nn 个 向 量 的 一 般 集合 (v0,… ,vn-1} 而 言 ， 为 了 将 其 正 交 化 
为 规范 正 交集 {wo，… ,wn-!1}， 我 们 就 要 使 用 格拉 姆 一 施 密 特 正 交 化 
(Gram-Schmidt Orthogonalization ) 方法 进行 处 理 。 


基本 步骤: 设 Lon 二 V0 


ti 一 1 
D1 一 Uj - >》_ projw, (vi) 


对 于 1 < in 一 1, 邻 j=0 





规范 化 步骤 : 令 中 il 


再 次 重申 ， 从 直观 上 来 说 ， 在 将 给 定 集合 内 的 问 量 vi 还 加 到 规范 正 
交集 中 时 ， 我 们 需要 令 vi 减 去 它 在 现 有 规范 正 交 集中 其 他 向 量 


wo, ww1,… ,wi-1) 方 向 上 的 分 量 〈 投 影 ”， 这 样 方 可 确保 新 加 入 规范 正 
交集 的 回 量 与 该 集合 中 的 其 他 向 量 互相 正 交 。 





1.4 又 积 


向 量 乘法 的 第 二 种 形式 是 又 积 〈cross product， 亦 称 向 量 积 、 外 
积 ) 。 与 计算 结果 为 标量 的 点 积 不 同 ， 叉 积 的 计算 结果 亦 为 向 量 。 此 
外 ， 只 有 3D 癌 量 的 又 积 有 定义 《〈 不 存在 2D 向 量 又 积 ) 。 假 设 3D 回 量 v 
和 w 的 叉 积 得 到 的 是 另 一 个 向 量 w， 则 ww 与 向 量 w、wv 彼 此 正 交 。 也 就 是 
说 ， 向 量 w 既 正 交 于 w， 也 正 交 于 wv， 如 图 1.13 所 示 。 如 果 * = (Vz, tu) 
，2 二 (Wz,Vy,V:)， 那 么 又 积 的 计算 方法 为 : 























WwW= UX v= (uv 一 UV Ur Ury:, Urvy 一 UyUz ) CY 


各 实际 采用 的 是 右手 坐标 系 ， 则 遵守 右手 拇指 法 则 (right-hand- 
thumb rule， 有 的 文献 也 称 之 为 右手 定 则 ) : 如 果 伸 出 右手 并 拢 手指 ， 
令 它 们 指向 第 一 个 向 量 w 的 方 辐 ， 再 以 0 < 6 科 T 的 角度 弯曲 四 指 ， 使 之 
指向 辐 量 v 的 方向 ， 那 么 ， 最 后 伸 直 拇指 的 方向 大 约 为 向量 w = w x vv 的 
方 问 。 

















图 1.13 ”两 个 3D 癌 量 V 与 的 又 积 得 到 的 是 : 既 正 交 于 人 也 正 交 于 z 的 向 量 迪 。 如 果 伸 出 左手 ， 
使 并 拢 的 左手 手指 指向 向 量 & 的 方向 ， 再 以 U 信 9 六 7 的 角度 弯曲 四 指 ， 使 之 指向 向 量 v 的 方 
向 ， 
那么 最 后 伸 直 的 大 拇指 约略 指向 的 即 为 ww 二 WX 也 的 方向 。 

这 就 是 所 谓 的 左手 拇指 法 则 (eft-hand-thumb rule， 有 的 文献 也 称 之 为 左手 定 则 ) 


























例 1.6 


设 向 量 = (2,1,3) 和 向 量 v = (2,0,0)。 计 算 w = wx wv 与 z= 二 vx， 


并 验证 问 量 w 既 正 交 于 向 量 w 又 正 交 于 同 量 v。 运 用 式 〈1.5) ， 有 : 

















= (2, 1, 3) x (2, 0, 0) 
= 


以 及 


根据 计算 结果 可 以 明确 地 得 出 一 项 结论 : 一 般 来 说 4 XV 了 郑 v Xx， 
即 向 量 的 又 积 不 满足 交换 律 。 事 实 上 ， 我 们 同时 也 能 够 证 明 
ux v= 一 vx wu， 这 正 是 又 积 的 反 交 换 律 。 叉 积 所 得 的 癌 量 可 以 通过 左 
手 拇指 法 则 来 加 以 确认 。 伸 出 左手 ， 如 果 并 拢 手指 指 同 的 为 参与 又 积 运 
算 第 一 个 向 量 的 方向 ， 再 弯曲 四 指 指向 参与 义 积 运算 第 二 个 癌 量 的 方向 
总 是 按 两 者 间 较 小 的 夹 角 弯 曲 四 指 。 如 果 无 法 做 到 ， 四 指 需要 向 手背 
方 问 旋转 ， 则 说 明 手 心 要 转 到 背 对 方向 ， 拇 指 最 终 指 辐 相 反方 向 ) ， 那 
么 伸 直 的 拇指 方 铝 即 为 所 求 义 积 的 向量 方 辐 ， 如 图 1.13 所 示 。 























为 了 证 明 问 量 w 既 正 交 于 疝 量 w 叉 正 交 于 问 量 v， 我 们 需要 用 到 1.3 市 
中 的 结论 : 如 果 w :wv = 0， 那 么 wlLv〔 即 两 个 同 量 彼 此 正 交 )〉 。 由 于 : 
wu = (0,.6,—2):(2.1.3)=0.:2+6:1 二 (一 2):3=0 
以 及 
wv = {0.6,—2):(2,0.0)=0:2+6:0+(-2):0=0 


由 此 可 以 推断 出 ; 向 量 w 既 正 交 于 向 量 w， 也 正 交 于 向 量 w。 


1.4.1 2D 问 量 的 伪 叉 积 








我 们 刚刚 证 明了 : 通过 又 积 可 以 求 出 与 两 个 指定 3D 癌 量 正 交 的 向 
量 。 在 2D 空间 中 虽然 不 存在 这 种 情况 ， 但 是 知 给 定 一 个 2D 回 量 

















4 二 (ur, Wy)， 我 们 还 是 能 通过 与 3D 向 量 又 积 相 似 的 方法 ， 求 出 与 u 正 交 
的 向 量 v。 图 1.14 从 几何 角度 展示 了 满足 上 述 条 件 的 向 量 ? = (uy)。 


形式 上 的 证 明 也 比较 简洁 : 





图 1.14 向量 & 的 2D 伪 叉 积 计算 结果 是 正 交 于 侯 的 向 量 


WV = (tzit) 一 tt = 一 zy 十 一 0 


因此 ，wlLv。 同 时 ， 不 难看 出 * 一 ?三 WWy 十 Wl 一 Wz) 二 0， 所 以 亦 
可 知 ul 一 v。 





1.4.2 ”通过 又 积 来 进行 正 交 化 处 理 


在 1.3.1 节 中 ， 我 们 曾 探 讨 了 可 以 使 向 量 集 正 交 化 的 方法 : 格拉 姆 一 

施 密 特 正 交 化 方法 。 对 于 3D 情 况 来 讲 ， 还 存在 男 外 一 种 与 义 积 有 关 的 

策略 ， 可 使 近乎 规范 正 交 的 向 量 集 {v0; v1,v2) 完 全 正 交 化 。 但 若 受 数值 

精度 误差 累积 的 影响 ， 也 许 会 导致 其 成 为 非 规 范 正 交集 。 图 1.15 中 几何 
图 示 所 对 照 的 又 积 处 理 流程 如 下 。 











图 1.15 ”通过 又 积 来 进行 正 交 化 处 理 3D 正 交 化 处 理 。 











vO 
0 一 
1， 令 lvzo|| 。 
WN Xx V1 
102 一 
2. 令 |wo x vil|。 





3. 令 w1 = 2 x wo， 根 据 练习 14 可 知 : 由 于 w2Lwo 且 wal| = eol 


1， 因 此 |w2 x wol| = 1。 所 以 ， 我 们 最 后 也 就 不 再 需要 对 它 进行 规范 化 
处 理 了 。 





此 时 ， 向 量 集 {taoo ww1,w2} 是 规范 正 交 的 。 


注 意 Note 于 


UD 


在 上 面 的 示例 中 ， 我 们 首先 令 ” ”jlvol|， 这 意味 着 将 向 量 vo 转换 到 











向量 wo 时 并 未 改变 方向 一 一 仅 缩放 了 wo 的 长 度 而 已 。 但 是 ， 向 量 凤 1 与 向 
量 w? 的 方 问 却 可 以 分 别 不同 于 同 量 w1 和 癌 量 wz。 对 于 特定 的 应 用 来 说 ， 
不 改变 集合 中 茶 个 同 量 的 方 癌 也 许 是 件 很 重要 的 事 。 例 如 ， 在 本 书后 
面 ， 我 们 会 利用 3 个 规范 正 交 向 量 {vo, v1,v2} 来 表示 摄像 机 (camera) 的 
朝向 ， 而 其 中 的 第 三 个 向 量 v2 描 述 的 正 是 摄像 机 的 观察 方向 。 在 对 这 些 
向 量 进行 正 交 化 处 理 的 过 程 中 ， 我 们 通常 并 不 希望 改变 此 摄像 机 的 观察 
方向 。 所 以 ， 我 们 会 运用 上 面 的 算法 ， 在 第 一 步 中 处 理 问 量 wz， 再 通过 
修改 向 量 vo 和 向 量 v1 来 使 它们 正 交 化 。 











1.5 点 


到 目前 为 止 ， 我 们 一 直 都 在 讨论 向 量 ， 却 还 没有 对 位 置 的 概念 进 
ee ei 
几何 体 的 位 置 和 3D 虚 拟 摄像 机 的 位 置 等 。 在 一 个 坐标 系 中 ， 通 过 一 个 
处 于 标准 位 置 的 同 量 〈( 见 图 1.16〉 束 能 表示 出 3D 空 间 中 的 特定 位 置 ， 我 
们 称 这 种 向 量 为 位 置 向 量 (position vector) 。 在 这 种 情况 下 ， 向 量 箭 
的 位 置 才 是 值得 关注 的 主要 特征 ， 而 方向 和 大 小 都 是 无 足 轻 重 的 。* 位 
置 疝 量 " 和 “点 ”这 两 个 术语 可 以 互相 蔡 代 ， 这 是 因为 一 个 位 置 向 量 足 以 
确定 一 个 点 。 














然而 ， 用 向 量 表示 点 也 有 副作用 ， 在 代码 中 则 更 为 明显 ， 因 为 部 分 
向 量 运 算 对 点 来 说 是 没有 意义 的 。 例 如 ， 两 点 之 和 的 意义 何在 ? 但 从 另 
方面 来 讲 ， 一 些 运 算 却 可 以 在 点 上 得 到 推广 。 如 ， 可 以 将 两 个 点 的 差 
q 一 了 定义 为 由 点 P 指 向 点 4q 的 向 量 。 同 样 ， 也 可 以 定义 点 P 与 向 量 v 相 
加 ， 其 意义 为 : 令 点 P 沿 疝 量 v 位 移 而 得 到 点 9g。 由 于 我 们 用 疝 量 来 表示 
坐标 系 中 的 点 ， 所 以 除了 刚刚 讨论 过 的 几 类 与 点 有 关 的 运算 外 便 无 须 再 
做 其 他 额外 的 工作 ， 这 是 因为 利用 向 量 代 数 的 框架 就 足以 解雇 点 的 描述 
问题 了 ， 详 见 图 1.17。 









































图 1.17 图 a 通过 4 一 PP 的 两 点 之 差 来 定义 由 点 P 指 向 点 4 的 向 量 。 图 b 中 点 P 与 向 量 V 的 和 可 以 定 
义 为 : 使 点 P 沿 着 向 量 v 位 移 而 得 到 点 4 


注 车 Note pp 


其 实 还 有 一 种 通过 几何 方式 来 定义 的 多 点 之 间 的 特殊 和 ， 即 仿 射 组 
合 (affine combination〉， 这 种 运算 的 过 程 就 像 求 取 诸 点 的 加 权 平 均 
值 。 


1.6 ”利用 DirectXMath 库 进行 向 量 运算 


对 于 Windows 8 及 其 以 上 版 本 来 讲 ，DirectXMath 〈 其 及 号 为 XNA 
Math 数 学 库 ，DirectXMath 正 是 基于 此 而 成 ) 是 一 于 为 Direct3D 应 用 程序 
量 吴 打造 的 3D 数 学 库 ， 而 它 也 自 此 成 为 了 Windows SDK 的 一 部 分 。 该 
数学 库 采 用 了 SIMD 流 指令 扩展 2〈Streaming SIMD Extensions 2， 

SSE2) 指令 集 。 借 助 128 位 宽 的 单 指令 多 数据 (Single Instruction 
Multiple Data，SIMD) 寄存 器 ， 利 用 一 条 SIMD 指 令 即 可 同时 对 4 个 32 位 
浮 点 数 或 整数 进行 运算 。 这 对 于 辐 量 运算 带 来 的 益处 是 不 言 而 喻 的 。 例 
如 ， 知 见 到 如 下 的 同 量 加 法 : 














WU 二 + = (Ut vr, yt Vy Us 十 了 :| 


我 们 按 普通 的 计算 方式 只 能 对 分 量 逐个 相 加 。 而 通过 SIMD 技 术 ， 
我 们 就 可 以 仅 用 一 条 SIMD 加 法 指令 来 取代 4 条 普通 的 标量 指令 ， 从 而 直 
接 计 算出 4D 回 量 的 加 法 结果 。 如 果 只 需要 进行 3D 数 据 运 算 ， 我 们 仍然 
可 以 使 用 SIMD 技 术 ， 但 是 要 忽略 第 4 个 坐标 分 量 。 类 似 地 ， 对 于 2D 运 
算 ， 则 应 名 略 第 3、4 个 坐标 分 量 。 


我 们 并 不 会 对 DirectXMath 库 进行 全 面 的 介绍 ， 而 只 是 针对 本 书 需 
要 的 关键 部 分 进行 讲解 。 关 于 此 库 的 所 有 细节 ， 可 以 参考 它 的 在 线 文档 
[DirectXMath]。 对 于 希望 了 解 如 何 开发 一 个 优秀 的 SIMD 回 量 库 ， 旋 至 
希望 深入 理解 DirectXMath 库 设计 原理 的 读者 ， 我 们 在 这 里 推荐 一 篇 文 
章 《Designing Fast Cross-Platform SIMD Vector Libraries (设计 快速 的 跨 
平台 SIMD 向 量 库 ) 》[Oliveira 2010]。 


为 了 使 用 DirectXMath 库 ， 我 们 需要 问 代 人 码 中 添加 头 文件 #include 
<DirectXMath.h>， 而 为 了 一 些 相关 的 数据 类 型 还 要 加 入 头 文件 
#include <DirectXPackedVector.h>。 除 此 之 外 并 不 需要 其 他 的 库 
文件 ， 因 为 所 有 的 代码 都 以 内 联 的 方式 实现 在 头 文 件 里 。DirectXMath.h 
文件 中 的 代码 都 存在 于 DirectX 命 名 空间 之 中 ， 而 
DirectXPackedVector.h 文 件 中 的 代码 则 都 位 于 DirectX: :PackedVector 
命名 空间 以 内 。 另 外 ， 针 对 x86 平 台 ， 我 们 需要 局 用 SSE2 指 令 集 

(Project Properties 〈 工 程 属 性 ) ~” Configuration Properties 〈 配 置 属 
性 ) -C/C++ ~ Code Generation (代码 生成 ) -, Enable Enhanced 
Instructon Set (启用 增强 指令 集 ) ) 。 对 于 所 有 的 平台 ， 我 们 还 应 当 
启用 快速 浮 点 模型 /fp:fast (Project Properties〈 工 程 属性 ) 
~Configuration Properties 〈 配 置 属性 ) -C/C++ Code 
Generation 〈 代 码 生 成 ) ”Floating Point Model( 浮 点 模型 ) ) 。 而 对 
于 x64 平 台 来 说 ， 我 们 却 不 必 开 启 SSE2 指 令 集 ， 这 是 因为 所 有 的 x64 
CPU 对 此 均 有 支持 。 








1.6.1 问 量 类 型 


在 DirectXMath 库 中 ， 核 心 的 癌 量 类 型 是 XMVECTOR， 它 将 被 映射 到 
SIMD 硬 件 寄存 器 。 通 过 SIMD 指 令 的 配合 ， 利 用 这 种 具有 128 位 的 类 型 
能 一 次 性 处 理 4 个 32 位 的 浮 点 数 。 在 开启 SSE2 后 ， 此 类 型 在 x86 和 x64 平 


台 的 定义 是 : 


typedef _m128 XMVECTOR ; 


这 里 的 _m128 是 一 种 特殊 的 SIMD 类 型 (定义 见 xmmintrin.h) 。 在 
计算 向 量 的 过 程 中 ， 必 须 通 过 此 类 型 才 可 充分 地 利用 SIMD 技 术 。 正 如 
前 文 所 述 ， 我 们 将 通过 SIMD 技 术 来 处 理 2D 和 3D 问 量 运算 ， 而 计算 过 程 
中 用 不 到 的 向 量 分 量 则 将 它 置 零 并 忽略 。 














XMVECTOR 类 型 的 数据 需要 按 16 字 节 对 齐 ， 这 对 于 局 部 变量 和 全 局 
变量 而 言 都 是 自动 实现 的 。 至 于 类 中 的 数据 成 员 ， 建 议 分 别 使 
用 XMFLOAT2 (2D 向 量 ) 、XMFLOAT3 (3D 疝 量 ) 和 XMFLOAT4 (4D 问 
量 ) 类 型 来 加 以 代替 。 这 些 结构 体 的 定义 如 下 上: 











struct XMFLOAT2 
{ 
float x; 
float y; 


XMFLOAT2() {} 

XMFLOAT2(float x, float y) : x(_x), y(_y) {} 

explicit XMFLOAT2(_In reads (2) const float *pArray) : 
x(pArray[8]), y(pArray[1]) {} 


XMFLOAT2& operator= (const XMFLOAT2& Float2) 
{ x = Float2.x; y = Float2.y; return *this; } 
}; 


struct XMFLOAT3 
{ 
float x; 
float y; 
float 2z; 


XMFLOAT3() {} 

XMFLOAT3(float x, float y, float z) : x(_x), y(_y), z(_z) {} 

explicit XMFLOAT3(_In reads (3) const float *pArray) : 
x(pArray[8]), y(pArray[1]), z(pArray[2]) {} 


XMFLOAT3& operator= (const XMFLOAT3& Float3) 
{ x = Float3.x; y = Float3.y; z = Float3.z; return *this; } 
}; 


struct XMFLOAT4 
{ 
float x; 
float y; 
float 2z; 
float w; 


XMFLOAT4() {} 

XMFLOAT4(float x, float y, float z, float w) : 
Xx(_Xx), yyYy), z(_z), w(_w) {} 

explicit XMFLOAT4(_In reads (4) const float *pArray) : 
x(pArray[@]), y(pArray[1]), z(pArray[2]), w(pArray[3]) {} 


XMFLOAT4& operator= (const XMFLOAT4& Float4) 
{ x = Float4.x; y = Float4.y; z = Float4.z; Ww = Float4.w; return 
*this; } 


}; 





但 是 ， 如 果 直 接 把 上 述 这 些 类 型 用 于 计算 ， 却 依然 不 能 充分 发 挥 出 
SIMD 技 术 的 高 效 特性 。 为 此 ， 我 们 还 需要 将 这 些 类 型 的 实例 转换 
为 XMVECTOR 类 型 。 转 换 的 过 程 可 以 通过 DirectXMath 库 的 加 载 函 数 
(loading function) 实现 。 相 反 地 ，DirectXMath 库 也 提供 了 用 来 
将 XMVECTOR 类 型 转换 为 XMFLOATn 类 型 的 存储 函数 (storage 


function) 。 


EE 


4 一 口 











1. 局 部 变量 或 全 局 变量 用 XMVECTOR 类 型 。 


2. 对 于 类 中 的 数据 成 员 ， 使 用 XMFLOAT2、XMFLOAT3 和 XMFLOAT4 


3. 在 运算 之 前 ， 通 过 加 载 函数 将 XMFLOATn 类 型 转换 为 XMVECTOR 


类 型 。 


4. 用 XMVECTOR 实 例 来 进行 运算 。 


5. 通过 存储 函数 将 XMVECTOR 类 型 转换 为 XMFLOATPn 类 型 


Eo 


1.6.2 ”加 载 方法 和 存储 方法 


用 下 面 的 方法 将 数据 从 XMFLOATn 类 型 加 载 到 XMVECTOR 类 型 : 


// 将 数据 从 XMFLOAT2 类 型 中 加 载 到 XMVECTOR 类 型 
XMVECTOR XM CALLCONV XMLoadFloat2(const XMFLOAT2 *pSource); 








// 将 数据 从 XMFLOAT3 类 型 中 加 载 到 XMVECTOR 类 型 
XMVECTOR XM CALLCONV XMLoadFloat3(const XMFLOAT3 *pSource); 








// 将 数据 从 XMFLOAT4 类 型 中 加 载 到 XMVECTOR 类 型 
XMVECTOR XM CALLCONV XMLoadFloat4(const XMFLOAT4 *pSource); 





用 下 面 的 方法 可 将 数据 从 XMVECTOR 类 型 存储 到 XMFLOATn 类 型 : 


// 将 数据 从 XMVECTOR 类 型 中 存储 到 XMFLOAT2 类 型 
void XM CALLCONV XMStoreFloat2(XMFLOAT2 *pDestination, FXMVECTOR V); 





// 将 数据 从 XMVECTOR 类 型 中 存储 到 XMFLOAT3 类 型 





void XM CALLCONV XMStoreFloat3(XMFLOAT3 *pDestination, FXMVECTOR V); 





// 将 数据 从 XMVECTOR 类 型 中 存储 到 XMFLOAT4 类 型 
void XM CALLCONV XMStoreFloat4(XMFLOAT4 *pDestination, FXMVECTOR V); 














当 我 们 只 希望 从 XMVECTOR 实 例 中 得 到 某 一 个 回 量 分 量 或 将 某 一 回 
量 分 量 转换 为 XMVECTOR 类 型 时 ， 相 关 的 存 取 方法 如 下 : 


float XM CALLCONV XMVectorGetX(FXMVECTOR V); 
float XM CALLCONV XMVectorGetY(FXMVECTOR V); 


float XM CALLCONV XMVectorGetZ(FXMVECTOR V); 
float XM CALLCONV XMVectorGetW(FXMVECTOR V); 


XMVECTOR XM CALLCONV XMVectorSetX(FXMVECTOR V, float x); 
XMVECTOR XM CALLCONV XMVectorSetY(FXMVECTOR V, float y); 
XMVECTOR XM CALLCONV XMVectorSetZ(FXMVECTOR V, float 2z); 
XMVECTOR XM CALLCONV XMVectorSetW(FXMVECTOR V, float w); 





1.6.3 ”参数 的 传递 


为 了 提高 效率 ， 可 以 将 XMVECTOR 类 型 的 值 作 为 函数 的 参数 ， 直 接 
传送 至 SSE/SSE2 寄 存 器 (register) 里 ， 而 不 存 于 栈 〈stack) 内。 以 此 
方式 传递 的 参数 数量 取决 于 用 户 使 用 的 平台 例如 ，32 位 的 Windows 系 
统 、64 位 的 Windows 系 统 及 Windows RT 系统 所 能 传递 的 参数 数量 都 各 不 
相同 ) 和 编译 器 。 因 此 ， 为 了 使 代码 更 具 通 用 性 ， 不 受 具体 平台 、 编 译 
器 的 有 影响， 我们 将 利用 FXMVECTOR、GXMVECTOR、HXMVECTOR 和 
CXMVECTOR 类 型 来 传递 XMVECTOR 类 型 的 参数 。 基 于 特定 的 平台 和 编译 
器 ， 它 们 会 被 自动 地 定义 为 适当 的 类 型 。 此 外 ， 一 定 要 把 调用 约定 注解 
XM_CALLCONV 加 在 函数 名 之 前 ， 它 会 根据 编译 器 的 版 本 确定 出 对 应 的 调 
用 约定 属性 。 





传递 XMVECTOR 参 数 的 规则 如 下 : 
1. 前 3 个 XMVECTOR 参 数 应 当 用 类 型 FXMVECTOR; 
2. 第 4 个 XMVECTOR 参 数 应 当 用 类 型 GXMVECTOR:; 


3. 第 5、6 个 XMVECTOR 参 数 应 当 用 类 型 HXMVECTOR:; 


其 余 的 XMVECTOR 参 数 应 当 用 类 型 CXMVECTOR。 


下 面 详解 这 些 类 型 在 32 位 Windows 平 台 和 编译 器 (编译 器 需要 文 
持 _fastcall 和 新 增 的 ”vectorcall 调 用 约定 ) 上 的 定义 : 











// 在 32 位 的 Windows 系统 上 ， 编 译 器 将 根据 _fastcall 调 用 约定 将 前 3 个 
// XMVECTOR 参 数 传 递 到 寄存 嚣 中， 而 把 其 余 参 数 都 存在 栈 上 

typedef const XMVECTOR FXMVECTOR; 

typedef const XMVECTOR& GXMVECTOR; 

typedef const XMVECTOR& HXMVECTOR; 

typedef const XMVECTOR& CXMVECTOR; 

































































// 在 32 位 的 Windows 系 统 上 ， 编 译 器 将 通过 vectorcall 调 用 约定 将 前 6 个 
// XMVECTOR 参 数 传递 到 寄存 器 中 ， 而 把 其 余 参数 均 存 在 栈 上 

typedef const XMVECTOR FXMVECTOR; 

typedef const XMVECTOR GXMVECTOR; 

typedef const XMVECTOR HXMVECTOR; 

typedef const XMVECTOR& CXMVECTOR; 









































对 于 这 些 类 型 在 其 他 平台 的 定义 细节 ， 可 参见 DirectXMath 库 文档 
中 “Library Internals《〈 库 的 内 部 细节 ) ”下 的 “Calling Conventions (调用 
约定 ) ”部 分 [DirectXMath]。 构 造 函 数 〈constructor) 方法 对 于 这 些 规则 
来 讲 却 是 个 例外 。[DirectXMath] 建 议 ， 在 编写 构造 函数 时 ， 前 3 
个 XMVECTOR 参 数 用 FXMVECTOR 类 型 ， 其 余 XMVECTOR 参 数 则 
用 CXMVECTOR 类 型 。 男 外 ， 对 于 构造 函数 不 要 使 用 XM_CALLCONV 注 解 。 


以 下 示例 截取 自 DirectXMath 库 的 源 代码 : 


inline XMMATRIX XM CALLCONV XMMatrixTransformation( 
FXMVECTOR ScalingOrigin, 
FXMVECTOR ScalingOrientationQuaternion, 


FXMVECTOR Scaling, 

GXMVECTOR Rotationorigin， 
HXMVECTOR RotationQuaternion, 
HXMVECTOR Translation); 





此 函数 有 6 个 XMVECTOR 参 数 ， 根 据 参数 传递 法 则 ， 前 3 个 参数 
用 FXMVECTOR 类 型 ， 第 4 个 参数 用 GXMVECTOR 类 型 ， 第 5 个 和 第 6 个 参数 
则 用 HXMVECTOR 类 型 。 


在 XMVECTOR 类 型 的 参数 之 间 ， 我 们 也 可 以 摊 杂 其 他 非 XMVECTOR 类 
型 的 参数 。 此 时 ，XMVECTOR 参 数 的 规则 依然 适用 ， 而 在 统计 XMVECTOR 
参数 的 数量 时 ， 会 对 其 他 类 型 的 参数 视 各 无 睹 。 例 如 ， 在 下 列 函数 中 ， 
前 3 个 XMVECTOR 参 数 的 类 型 依旧 为 FXMVECTOR， 第 4 个 XMVECTOR 参 数 的 
类 型 仍 为 GXMVECTOR。 
inline XMMATRIX XM CALLCONV XMMatrixTransformation2D( 


FXMVECTOR ScalingOrigin, 
float ScalingOrientation, 


FXMVECTOR Scaling, 
FXMVECTOR RotationOrigin, 
float Rotation, 
GXMVECTOR Translation); 





传递 XMVECTOR 参 数 的 规则 仅 适 用 于 “输入 ”参数 。“ 输 出 ”的 
XMVECTOR 参 数 〈 即 XMVECTOR& 或 XMVECTOR*+ ) 则 不 会 占用 SSE/SSE2 寄 
存 器 ， 所 以 它们 的 处 理 方式 与 非 XMVECTOR 类 型 的 参数 一 致 。 


1.6.4 和 常 向 量 





XMVECTOR 类 型 的 常量 实例 应 当 用 XMVECTORF32 类 型 来 表示 。 在 
DirectX SDK 中 的 CascadedShadowMaps11 示 例 内 就 可 见 到 这 种 类 型 的 应 
用 : 


static const XMVECTORF32 g _vHalfVector = { 86.5f, 6.5f, 86.5f, 8.5f }; 


static const XMVECTORF32 8g_VvZero = { 6.6f，6.6f，6.6f，6.6f }; 


XMVECTORF32 vRightTop = { 
vViewFrust.RightSlope, 
vViewFrust.TopSlope, 
1.6f,1.6f 

}; 


XMVECTORF32 vLeftBottom = { 
vViewFrust.LeftSlope, 
vViewFrust.BottomSlope, 
1.6f,1.6f 

}; 





基本 上 ， 在 我 们 运用 初始 化 语法 的 时 候 就 要 使 用 XMVECTORF32 类 
型 。 





XMVECTORF32 是 一 种 按 16 字 节 对 齐 的 结构 体 ， 数 学 库 中 还 提供 了 将 
它 转换 至 XMVECTOR 类 型 的 运算 符 。 其 定义 如 下 : 





// 将 常 向 量 转换 为 其 他 类 型 的 运算 符 
declspec(align(16)) struct XMVECTORF32 
{ 


union 





float f[4]; 
XMVECTOR v; 


}; 


inline operator XMVECTOR() const { return v; } 
inline operator const float*() const { return f; } 

#if ldefined( XM NO INTRINSICS ) && defined( XM SSE INTRINSICS ) 
inline operator m128i() const { return mm castps si128(v); } 
inline operator m128d() const { return mm castps pd(v); } 

#endif 


}; 





另外 ， 也 可 以 通过 XMVECTORU32 类 型 来 创建 由 整 型 数据 构成 的 
XMVECTOR 常 向 量 : 





static const XMVECTORU32 vGrabY = { 
6Xx66666666 ,9XFFFFFFFF ,6Xx66666666 ,90X660666666 


}; 





1.6.5 ” 重 载 运算 符 


XMVECTOR 类 型 针对 向 量 的 加 法 运算 、 减 法 运算 和 标量 乘法 运算 ， 
都 分 别提 供 了 对 应 的 重 载运 算 符 。 


XMVECTOR 
XMVECTOR 


XMVECTORE& 
XMVECTORE& 
XMVECTORE& 
XMVECTORE& 


XMVECTORE& 
XMVECTORE& 


XMVECTOR 
XMVECTOR 
XMVECTOR 
XMVECTOR 
XMVECTOR 
XMVECTOR 
XMVECTOR 


1.6.6 


XM_CALLCONV 
XM_CALLCONV 


XM_CALLCONV 
XM_CALLCONV 
XM_CALLCONV 
XM_CALLCONV 


operator+ (FXMVECTOR V); 
operator- (FXMVECTOR V); 


operator+== (XMVECTOR& V1, FXMVECTOR V2); 
operator-= (XMVECTOR& V1, FXMVECTOR V2); 
operator*= (XMVECTOR& V1, FXMVECTOR V2); 
operator/= (XMVECTOR& V1, FXMVECTOR V2); 


operator*= (XMVECTOR& V, float S); 
operator/= (XMVECTOR& V, float S); 


XM_CALLCONV 
XM_CALLCONV 
XM_CALLCONV 
XM_CALLCONV 
XM_CALLCONV 
XM_CALLCONV 
XM_CALLCONV 


杂项 


operator+ (FXMVECTOR V1，FXMVECTOR V2) 
operator- (FXMVECTOR V1, FXMVECTOR V2) 
operator* (FXMVECTOR V1, FXMVECTOR V2); 
operator/ (FXMVECTOR V1, FXMVECTOR V2); 
operator* (FXMVECTOR V, float S); 
operator* (float S, FXMVECTOR V); 
operator/ (FXMVECTOR V, float S); 











DirectXMath 库 定义 了 一 组 与 + 有 关 的 常用 数学 常量 近似 值 : 





const float XM PI 和 
const float XM 2PI = 
const float XM 1DIVPI 
const float XM 1DIV2PI 
const float XM PIDIV2 


3.141592654f; 

6.283185367f; 

= 6.318369886f; 

= 0.159154943f; 
1.576796327f; 


const float XM_PIDIV4 = 6.785398163f; 
另外 ， 它 用 下 列 内 联 函 数 实现 了 弧度 和 角度 间 的 互相 转化 : 


inline float XMConvertToRadians(float fDegrees ) 
{ return fDegrees * (XM PI / 186.6f); } 


inline float XMConvertToDegrees(float fRadians) 
{ return fRadians * (186.6f / XM PI); } 





DirectXMath 库 还 定义 了 求 出 两 个 数 间 较 大 值 及 较 小 值 的 函数 : 


了 


template<class T> inline T XMMin(T a，T b) { return (a < b) ?a: b;} 
templatex<class T> inline T XMMax(T a，T b) { return (a > b) ?a: bi } 





1.6.7 Setter 国 数 


DirectXMath 库 提供 了 下 列 函 数 ， 以 设置 XMVECTOR 类 型 中 的 数据 : 
// 返回 零 向 量 6 
XMVECTOR XM_CALLCONV XMVectorZero( ) ; 


// 返回 向 量 (1，1，1，1) 
XMVECTOR XM CALLCONV XMVectorSplatone(); 








// 返回 问 量 (x,，y，z，w) 
XMVECTOR XM CALLCONV XMVectorSet(float x, float y, float z, float w); 








// 返回 向 量 (Value,， Value, Value, Value) 
XMVECTOR XM CALLCONV XMVectorReplicate(float Value); 








// 返回 向 量 (Vx，vVx， vx， Vx) 
XMVECTOR XM CALLCONV XMVectorSplatX(FXMVECTOR V); 











// 返回 向 量 (w，w，w，vy) 
XMVECTOR XM CALLCONV XMVectorSplatY(FXMVECTOR V); 





// 返回 向 量 (Vs， Vz， Vz, V2) 
XMVECTOR XM CALLCONV XMVectorSplatZz(FXMVECTOR V); 











下 列 的 示例 程序 详细 地 解释 了 上 面 大 多 数 函 数 的 用 法 : 





#include <windows.h> // 为 了 使 XMVerifyCPUSupport 函 数 返 回 
#include “DirectXMath .hy> 

#include <DirectXPackedVector.h> 

#include <iostream> 

using namespace std; 

using namespace DirectX; 

using namespace DirectX::PackedVector; 























// 重 载 "<x<" 运 算 符 ， 这 样 就 可 以 通过 cout 函 数 输出 XMVECTOR 对 象 
ostream& XM CALLCONV operator<<(ostream& os, FXMVECTOR V) 
{ 

XMFLOAT3 dest; 

XMStoreFloat3(&dest, v); 





os << "(" <x< dest.x 《< ",， << dest.y 《< "， <x< dest.z << ")"; 
return os; 


} 


int main() 


{ 


cout.setf(ios base::boolalpha); 


























// 检查 是 否 支 持 SSE2 指 令 集 (Pentium4，AMD K8 及 其 后 续 版 本 的 处 理 
if (!XMVerifyCPUSupport()) 
{ 


























cout << "directx math not supported" << endl; 
return 0; 


} 


XMVECTOR XMVectorZero(); 

XMVECTOR XMVectorSplatOne(); 

XMVECTOR XMVectorSet(1.9f，2.6f，3.6f，6.6f); 
XMVECTOR XMVectorRep1licate(-2.6f); 

XMVECTOR XMVectorSplatZ(u); 


cout 《< << << endl; 
cout 《< << << endl; 
cout «<< << << endl; 
cout «<< << << endl; 
cout «<< << << endl; 


return 0; 





上 述 示例 程序 的 输出 结果 如 图 1.18 所 示 。 





本 C\Windows\system32\cmd.exe en x 











图 1.18 示例 程序 输出 的 结果 





1.6.8” 癌 量 函 数 


DirectXMath 库 提供 了 下 面 的 函数 来 执行 各 种 癌 量 运算 。 我 们 主要 





围 纸 3D 辐 量 的 运算 函数 进行 讲解 ， 类 似 的 运算 还 有 2D 和 4D 版 本 。 除 了 
表示 维度 的 数字 不 同 以 外 ， 这 几 种 版 本 的 函数 名 和 皆 同 。 








XMVECTOR XM CALLCONV XMVector3Length( // 返回 ||v|| 
FXMVECTOR V); // 输入 向 量 v 


XMVECTOR XM CALLCONV XMVector3Lengthsq( // 返 回 | |v| |? 











FXMVECTOR V); // 输入 向 量 v 
XMVECTOR XM CALLCONV XMVector3Dot( // 返回 vi*v，> 
FXMVECTOR V1, // 输入 向 量 v1 
FXMVECTOR V2); // 输入 回 量 v， 
XMVECTOR XM CALLCONV XMVector3Cross( // 返回 v1xv> 
FXMVECTOR V1, // 输入 回 量 v1 
FXMVECTOR V2); // 输入 回 量 v， 








XMVECTOR XM CALLCONV XMVector3Normalize(  // 返回 v/| |v|| 
FXMVECTOR V); // 输入 向 量 v 





XMVECTOR XM_CALLCONV XMVector30rthogonal( ”// 返回 一 个 正 交 于 v 的 向 量 
FXMVECTOR V) ; // 输入 向 量 v 





XMVECTOR XM_CALLCONV 


XMVector3AngleBetweenVectors( // 返回 v1 和 v5 之 间 的 夹 角 
FXMVECTOR V1， // 输入 向 量 vj 
FXMVECTOR V2); // 输入 向 量 v， 


void XM CALLCONV XMVector3ComponentsFromNormal( 


XMVECTOR* pparallel, // 返回 projn(v) 
XMVECTOR* pPerpendicular， // 返回 perpn (Vv) 
FXMVECTOR V， // 输入 向 量 v 
FXMVECTOR Normal); // 输入 规范 化 回 量 n 
bool XM CALLCONV XMVector3Equal( // 返回 vi == v2? 
FXMVECTOR V1, // 输入 向 量 v1 
FXMVECTOR V2); // 输入 问 量 v， 


bool XM CALLCONV XMVector3NotEqual( // 返回 vixv。 








FXMVECTOR V1, // 输入 同 量 vj 
FXMVECTOR V2); // 输入 向 量 v， 





注 意 Note 一 


可 以 看 到 ， 即 使 在 数学 上 计算 的 结果 是 标量 (如 点 积 * = v1: 22) ， 
但 这 些 函 数 所 返回 的 类 型 依旧 是 XMVECTOR， 而 得 到 的 标量 结果 则 被 复 
制 到 XMVECTOR 中 的 各 个 分 量 之 中 。 例 如 点 积 ， 此 函数 返回 的 同 量 为 ( 
21 v2, V1 V2,21' 8201 v2) 。 这 样 做 的 原因 之 一 是 : 将 标量 和 SIMD 问 
量 的 混合 运算 次 数 降 到 最 低 ， LEE wa 
SIMD 技 术 ， 以 提升 计算 效率 。 








下 面 的 程序 演示 了 如 何 使 用 上 述 大 部 分 图 数 ， 其 中 还 示范 了 一 些 重 
载运 算 符 的 用 法 : 


#include <windows.h> // 为 了 使 XMVerifyCPUSupport 函 数 返 回 正确 值 
#include “DirectXMath .hy> 

#include <DirectXPackedVector.h> 

#include <iostream> 

using namespace std; 

using namespace DirectX; 

using namespace DirectX: :PackedVector; 


























// 对 "<<" 运 算 符 进行 重 载 ， 这 样 就 可 以 通过 cout 函 数 输 出 XMVECTOR 对 象 
ostream& XM CALLCONV operator<<(ostream& os, FXMVECTOR v) 
{ 

XMFLOAT3 dest; 

XMStoreFloat3(&dest, v); 


os << "(" <x dest.x << 
return os; 


} 


<< dest.y 《< <«< dest.z << ")"; 


int main() 


{ 


cout.setf(ios base::boolalpha); 
































T 


// 检查 是 否 支 持 SSE2 指 令 集 (Pentium4，AMD K8 及 其 后 续 版 本 的 处 理 器 ) 
if (!XMVerifyCPUSupport()) 
{ 











cout << "directx math not supported" << endl; 
return 0; 


} 


XMVECTOR n = XMVectorSset(1.6f, 0.6f, 60.06f, 0.6f); 
XMVECTOR u = XMVectorSet(1.6f, 2.06f, 3.06f, 0.6f); 
XMVECTOR v = XMVectorSet(-2.6f, 1.0f, -3.6f, 0.6f); 
XMVECTOR w = XMVectorSet(0.7067f, 60.707f, 0.6f, 0.6f); 


























// 向 量 加 法 : 利用 XMVECTOR 类 型 的 加 法 运算 符 + 十 
XMVECTOR a =uUu+yvV; 



































// 向 量 减法 : 利用 XMVECTOR 类 型 的 减法 运算 符 - 
XMVECTOR b =u -v; 


























// 标量 乘法 : 利用 XMVECTOR 类 型 的 标量 乘法 运算 符 * 
XMVECTOR c = 10.6f*u; 








// llull 
XMVECTOR L = XMVector3Length(u); 


//d=u/ |lull 


XMVECTOR d = XMVector3Normalize(u); 


//SsSs=Udotv 
XMVECTOR s = XMVector3Dot(u, v); 


//e=UXV 
XMVECTOR e = XMVector3Cross(yu, Vv); 

// 求 出 proj_n(w) 和 perp_n(w) 

XMVECTOR projW; 

XMVECTOR perpW; 
XMVector3ComponentsFromNormal(&projW, &perpW, w, n); 


// projW + perpW == w? 
bool equal = XMVector3Equal(projW + perpW, w) != 0; 
bool notEqual = XMVector3NotEqual(projW + perpW, w) != 6 





// projW 与 perpW 之 间 的 夹 角 应 为 98 度 

XMVECTOR angleVec = XMVector3AngleBetweenVectors(projW, perpW); 
float angleRadians = XMVectorGetX(angleVec); 

float angleDegrees = XMConvertToDegrees(angleRadians); 











cout << "U =" << UU << endl; 
cout << "Vv =" << Vv <x< endl; 
cout << "Ww =" << Ww << endl; 
cout << "n =" << nNn << endl; 
cout << "a=u+yV =" << a xx endl; 
cout << "b=u-yv =" << b <x< endl; 
cout << "c= 106 * U =" << cc «<x endl; 
cout << "d=u/ ||lu|l| =" << d << endl; 
cout << "e =UuXxV =" << @ <x endl; 
cout << "L = ||ul| =" << |L <x< endl; 
cout << "s = U.V =" << s <x< endl; 
cout “< "projW = " << projW “< endl; 


cout << “perpW 


= " << perpN << endl; 
cout << "projW + perpW == 


W = << equal “< endl; 
cout “< "projW + perpN !I=w = " << notEqual << endl; 
cout “< "angle = " << angleDegrees << endl; 


return 0; 





上 述 示 例 程 序 的 输出 结果 如 图 1.19 所 示 。 








本 C\Windows\system32\cmd exe eng 





9 ee 
lm 
: (0.707, 0.707, 90) 
| 
i J | 
| 
:【〔(196，26，39) 
=: (0.267261, ©.534522, 0Q.801784) 
Ein 


(3.74166, 3.74166, 3.74166) 
和 2 -9) 


| 
| + perpu t= 有 











图 1.19 示例 程序 的 输出 结果 





DirectXMath 库 也 提供 了 一 些 估算 方法 ， 精 度 低 但 速度 快 。 如 果 愿 
意 为 了 速度 而 牺牲 一 些 精 度 ， 则 可 以 使 用 它们 。 下 面 是 两 个 估算 方法 的 
例子 。 





XMVECTOR XM CALLCONV XMVector3LengthEst( // 返回 估算 值 | |v|| 
FXMVECTOR V); // 输入 v 








XMVECTOR XM CALLCONV XMVector3NormalizeEst( ”// 返回 估算 值 v/ | |v|| 
FXMVECTOR V); // 输入 v 





1.6.9 浮 点 数 误 差 


在 用 计算 机 处 理 与 同 量 有 关 的 工作 时 ， 我 们 应 当 了 解 以 下 的 内 容 。 
在 比较 浮 点 数 时 ， 一 定 要 注意 浮 点 数 存 在 的 误差 。 我 们 认为 相等 的 两 个 








序 点 数 可 能 会 因此 而 有 细微 的 兰 别 。 例 如 ， 已 知 在 数学 上 规范 化 同 量 的 
长 度 为 1， 但 是 在 计算 机 程序 中 的 表达 上 ， 问 量 的 长 度 只 能 接近 于 1。 此 
外 ， 在 数学 中 ， 对 于 任意 实数 P 有 1? = 1。 但 是 ， 当 只 能 在 数值 上 逼近 1 
时 ， 随 着 虹 P 的 增加 ， 所 求 近 似 值 的 误 盈 也 在 逐渐 增 大 。 由 此 可 见 ， 数 
值 误差 是 可 积累 的 。 下 面 这 个 小 程序 可 印证 这 些 观 操 : 








#include <windows.h> // 为 了 使 XMVerifyCPUSupport 函 数 返回 
#include “DirectXMath .hy> 

#include <DirectXPackedVector.h> 

#include <iostream> 

using namespace std; 

using namespace DirectX; 

using namespace DirectX::PackedVector; 


int main() 


{ 


cout .precision(8); 





























// 检查 是 否 支 持 SSE2 指 令 集 (Pentium4，AMD K8 及 其 后 续 版 本 的 处 理 器 ) 
if (!XMVerifyCPUSupport()) 
{ 


cout << "directx math not supported" << endl; 
return 0; 


} 

















XMVECTOR XMVectorSet(1.9f，1.6f，1.6f，6.6f); 
XMVECTOR XMVector3Normalize(u); 


float LU = XMVectorGetX(XMVector3Length(n)); 


// 在 数学 上 ， 此 向 量 的 长 度 应 当 为 1。 在 计算 机 中 的 数值 表达 上 也 是 如 此 吗 ? 
cout << LU << endl; 
if (LU == 1.6f) 
cout << "Length 1" << endl; 
else 
cout << "Length not 1" << endl; 


























// 1 的 任意 次 方 都 是 1。 但 是 在 计算 机 中 ， 事 实 确实 如 此 吗 ? 
float powLU = powf(LU, 1.86e6f); 
cout << "LU^(16^6) = " «<x powLU << endl; 














上 述 示例 程序 的 输出 结果 如 图 1.20 所 示 。 





| C\Windows\system32\cmd.exe | = 和 | Sl | 











图 1.20 示例 程序 输出 的 结果 


为 了 弥补 浮 点 数 精确 性 上 的 不 足 ， 我 们 通过 比较 两 个 浮 点 数 是 否 近 
似 相 每 来 加 以 解决 。 在 比较 的 时 候 ， 我 们 需要 定义 一 个 Epsilon 和 当量 ， 
它 是 个 非常 小 的 值 ， 可 为 误差 留 下 一 定 的 “缓冲 ”余地 。 如 果 两 个 数 相 差 
的 值 小 于 Epsilon， 我 们 就 说 这 两 个 数 是 近似 相等 的 。 换 句 话 
说 ，Epsilon 是 针对 浮上 点 数 的 误差 问题 所 指定 的 容 兰 (tolerance) 。 下 
面 的 函数 解释 了 如 何 利 用 Epsilon 来 检测 两 个 浮 点 数 是 否 相等 : 


const float Epsilon = 0.6061f; 
bool Equals(float lhs, float rhs) 


// lhs 和 和 rhs 相差 的 值 是 否 小 于 EPSILON? 
return fabs(lhs - rhs) < Epsilon ? true : false; 





对 此 ，DirectXMath 库 提供 了 XMVector3NearEqual 函 数 ， 用 于 以 
Epsilon 作 为 容 差 ， 测 试 比较 的 向 量 是 否 相等 : 


返回 
abs(U.x - V.x) <= Epsilon.x && 
abs(U.y - V.y) <= Epsilon.y && 
abs(U.z - V.z) 《= Epsilon.z 





XMFINLINE bool XM CALLCONV XMVector3NearEqual( 
FXMVECTOR U， 
FXMVECTOR V， 
FXMVECTOR Epsilon); 





| Wy 站 人 





1. 回 量 可 以 用 来 模拟 同时 具有 大 小 和 方 癌 的 物理 量 。 在 几何 学 
上 ， 我 们 用 有 向 线段 表示 向 量 。 当 向量 平移 至 尾部 与 所 在 坐标 系 原点 恰 
好 重合 的 位 置 时 ， 向 量 位 于 标准 位 置 。 一 旦 向 量 处 于 标准 位 置 ， 我 们 便 
可 以 用 癌 量 头 部 相对 于 坐标 系 的 坐标 来 作为 它 的 数学 描述 。 





























2. 假设 有 向 量 = (wz wu) 和 向 量 " = (or 2)， 那 么 就 能 对 它们 
进行 下 列 问 量 计算 。 


(a》 加 法 运算 : 全 十 人 一 (Uz + Vz, Uy + Uy, Us + U- } 
(b) 减法 运算 : & 一 TY 王 (uz - Ur, Uy 人 Uy, UU: = U.) 
(c) 标量 乘法 运算 :， Au = (Kuz, kuy, Ku: ) 


人 


Cd) 向量 长 度 : |u| = Vz2 十 只 十 2 





. u 工 1 Z 
Ce) 规范 化 :ul ( 击 ull Ei) 


十 UU. 


Cf) 点 积 ; ua= lullllellcose = uvs + wyoy 


(g) 又 积 : 1 X 人 一 (uyv. — UU, Ur 一 Mr Urvy 一 UyUz) 





3. 用 DirectXMath 库 的 XMVECTOR 类 型 来 描述 向 量 ， 这 样 就 可 以 在 
代码 中 利用 SIMD 技 术 进 行 高 效 的 运算 。 对 于 类 中 的 数据 成 员 来 说 ， 要 








使 用 XMFLOAT2、XMFLOAT3 和 XMFLOAT4 这 些 类 表示 向 量 ， 并 通过 加 载 和 
存储 方法 令 数据 在 XMVECTOR 类 型 与 XMFLOATn 类 型 之 间 互 相 转化 。 另 
外 ， 在 使 用 常 上 铝 量 的 初始 化 语法 时 ， 应 当 采 用 XMVECTORF32 类 型 。 


4. 为 了 提高 效率 ， 当 XMVECTOR 类 型 的 值 被 当 作 参数 传 入 函数 时 ， 
可 以 直接 人 存 入 SSE/SSE2 寄 存 器 中 而 不 是 栈 上 。 要 令 代 码 与 平台 无 关 ， 
我 们 将 使 用 FXMVECTOR、GXMVECTOR、HXMVECTOR 和 CXMVECTOR 类 型 来 
传递 XMVECTOR 参 数 。 传 递 XMVECTOR 参 数 的 规则 为 : 前 3 个 XMVECTOR 参 
数 应 当 用 FXMVECTOR 类 型 ， 第 4 个 XMVECTOR 参 数 用 GXMVECTOR 类 型 ， 第 
5 个 和 第 6 个 XMVECTOR 参 数 用 HXMVECTOR 类 型 ， 而 其 余 的 XMVECTOR 类 型 
参数 则 用 CXMVECTOR 类 型 。 





5. XMVECTOR 类 重 载 了 一 些 运算 符 用 来 实现 同 量 的 加 法 、 减 法 和 标 
量 乘法 。 另 外 ，DirectXMath 库 还 提供 了 下 面 一 些 实用 的 函数 ， 用 于 计 
算 向 量 的 模 、 模 的 平方 、 两 个 向 量 的 点 积 、 两 个 向 量 的 又 积 以 及 对 向量 
进行 规范 化 处 理 : 








XMVECTOR XM CALLCONV XMVector3Length(FXMVECTOR V); 
XMVECTOR XM CALLCONV XMVector3LengthSq(FXMVECTOR V); 


XMVECTOR XM CALLCONV XMVector3Dot(FXMVECTOR V1, FXMVECTOR V2); 
XMVECTOR XM CALLCONV XMVector3Cross(FXMVECTOR V1, FXMVECTOR V2); 
XMVECTOR XM CALLCONV XMVector3Normalize(FXMVECTOR V); 





1.8 ”练习 


， 设 向 量 = (1,2) 和 向 量 v = (3, 一 4)。 写 出 下 列 各 式 的 演算 过 程 ， 
并 在 2D 华 标 系 内 男 出 相应 的 同 量 。 


(a) Ut+v 
(b) uw 


2 十 一 0 


(Cc) 2 
(d) —2u+wv 


2. 设 向 量 4 = (一 1,3,2) 和 向 量 v = (3, 一 4,1)。 写 出 下 列 问 题 的 解答 


(a) UT+v 
(b) uw 
(CC) 3u+2v 


(d) 一 24 十 了 





人 
以 下 清单 中 所 列举 的 性 质 并 不 完整 ) 。 假 设 有 向 量 4 = (1 如)、 


v = (vz, Vy, VU. ) 和 也 = (Wz, Wy, tw ) 


， ne 请 证 明 下 列 问 量 性 质 。 


(a) +u =v+u (加 法 交换 律 ) 

(Cb) w+ (V+w) = (4+V) 二 如 (加 法 结合 律 ) 
Cc) (chu = clhu) (标量 乘法 的 结合 律 ) 

(d) ku +v) = 二 (分配 律 1) 


Ce) wu 十 0) = 二 ku 十 cu (分 配 律 2) 


提示 


仅 利 用 癌 量 运算 的 定义 和 实数 的 性 质 即 可 完成 证 明 。 例 如 ， 
(ck)w = (ck) (uzr, uy, u:) 
= ((ck)uz, (ck)u,, (ck)u.) 
(c (Kur) ,c (kuy) ,cc (ku.)) 


c (kuzr, kuy, ku:) 








4. 根据 等 式 2[(1,2,3) 一 z] 一 (2,0,4) = 一 2(1,2,3)， 求 其 中 的 向 量 z 


5. 设 向 量 w = (1,3,2) 和 向 量 v? = (3, 一 4,1)。 对 wu 和 w 进 行规 范 化 处 














6， 设 /为 标量 ， 向 量 < = (ur us)。 求 语 |u|| = | 


O 





7. 下 列 各 组 向 量 中 ，v 与 v 之 间 的 夹 角 是 直角 、 锐 角 还 是 钝 角 ? 
(a) Lu = (1,1,1), v = (2,3,4) 


(by w= {1,1,0), v = (一 2,2.0) 





9. 设 向 量 % = (Uz;Wyy4)、V = (Vz, Vy,V:) 和 Ww = (Wz, Wy, :)， 日 c 和 有 


为 标量 。 证 明 下 列 点 积 性 质 。 
(a) 了 :了 一 站 人 
(b) wv+w) 一 人 :了 十 由 :0 
(cy Ku mu) 一 (ka v=: (Ku) 
Cd) vv=|vl 


(e) 0:v=0 





仅 利 用 前 文 介 绍 的 各 种 定义 即 可 证 明 ， 例 如 ， 


VV = Vrvzr 十 Taby tt UU: 





10. 利用 余弦 定理 (c=a+b— 2abcost, 其 中 心 b、 Cc 分 分 别 是 三 
角形 3 条 边 的 边 长 ，9 为 a 与 之 间 的 夹 角 〉 来 证 明 : 


Uzvz + Uvy t+ Lvs = ||ul| ||v|| cosl 


提示 


参考 图 1.9， 设 c= 上 一 ov 下 ， 以 及 ”= wv， 再 运用 上 一 个 习题 中 
得 到 的 点 积 性 质 即 可 。 


11. 设 向 量 n = (-2,1)。 将 向 量 9 (0, -9.8) 分 解 为 两 个 相互 正 交 的 
癌 量 之 和 和， 使 它们 一 个 平行 于 n、 一 个 正 交 于 n。 最 后 ， 在 同一 2D 坐 标 
系 中 国 出 这 些 癌 量 。 





12. 设 向 量 = (-2;14) 和 向 量 vw = (3, 一 4,1)。 求 向 量 w = wx vw， 再 
证 明 zw :w= 0 及 wv 二 0。 





13. 设 A4=(0,0,0)，B = (0,1,3) 和 C = (5,1,0) 三 点 在 某 坐 标 系 中 定 
义 了 一 个 三 角形 。 求 出 一 正 交 于 此 三 角形 的 问 量 。 


, 
提示 


先 求 出 位 于 三 角形 任意 两 条 边 上 的 两 个 向 量 ， 再 对 它们 进行 义 积 运 
算 即 可 。 


14. 证 明 llw x w= lullllvl| sin9, 


提示 


从 lulllivllsin9 一 侧 开 始 证 明 ， 先 利用 三 角 恒 等 式 
cos*:0+sin 0=1 志 sing = V1 一 cos20， 村 过 有 半 取 民主 是 





15. 证 明 : 由 向 量 w 和 向 量 w 张 成 的 平行 四 边 形 面积 为 性 xz， 如 图 
1.21 所 示 [81。 





图 1.21 由 向 量 w 和 向 量 2 张 成 的 平行 四 边 形 。 此 平行 四 边 形 的 底 为 ol 且 高 为 P 








16. 举例 证 明 : 存在 3D 辐 量 w、w 和 ww， 满 足 
wx (vx mg) 关 (ux 0) x ww。 这 说 明 又 积 一 般 不 满足 结合 


, 
提示 


考虑 这 个 简单 的 向 量 组 合 : 人 0 7 00Nk = (1), 














证 明 两 个 非 零 且 相互 平行 癌 量 的 又 积 为 零 问 量 ， 即 wx ku=0 


提示 


直接 利用 又 积 定 义 即 可 。 





18. 利用 格拉 姆 一 施 密 特 正 交 化 方法 ， 令 问 量 集 
{(1,0,0), (1,5,0),(2,1, 一 49} 规 范 正 交 化 。 


19. 思考 下 面 的 程序 及 其 输出 结果 〈 见 图 1.22) 。 猜 测 其 中 每 
个 XMVector* 函 数 的 功能 。 然 后 在 DirectXMath 文 档 中 ， 查 阅 每 个 函数 
的 相关 信息 上 9。 

















#include <windows.h> // 为 了 使 用 XMVerifyCPUSupport 函 数 返 回 正确 值 


#include “DirectXMath .hy> 

#include <DirectXPackedVector.h> 
#include <iostream> 

using namespace std; 

using namespace DirectX; 

using namespace DirectX::PackedVector; 


// 重 载 "<<" 运 算 符 ， 这 样 便 可 以 使 用 cout 输 出 XMVECTOR 对 象 
ostream& XM CALLCONV operator<<(ostream& os, FXMVECTOR V) 
{ 

XMFLOAT4 dest; 

XMStoreFloat4(&dest, v); 











os << "(" <x< dest.x < ",， <«< dest.y << "， 
<x< dest.z < ", " << dest.w << ")"; 
return os; 


} 


int main() 


{ 


cout.setf(ios base::boolalpha); 






































// 检查 是 否 支持 SSE2 指 令 集 (Pentium4，AMD K8 及 其 后 续 版 本 的 处 理 器 ) 
if (!XMVerifyCPUSupport()) 








{ 
cout << "directx math not supported" << endl; 
return ©; 
} 
XMVECTOR p = XMVectorSet(2.6f, 2.6f, 1.6f, 60.6f); 
XMVECTOR q = XMVectorSet(2.6f, -0.5f, 0.5f, 06.1f); 
XMVECTOR UuU = XMVectorSet(1.6f, 2.6f, 4.6f, 8.6f); 
XMVECTOR v = XMVectorSet(-2.6f, 1.6f, -3.6f, 2.5f); 
XMVECTOR WwW = XMVectorSet(6.6f, XM PIDIV4, XM PIDIV2, XM PI); 


cout << "XMVectorAbs(v) = " << XMVectorAbs(v) << endl; 


cout << "XMVectorCos(w) = " << XMVectorCos(w) << endl; 
cout << "XMVectorLog(u) = " << XMVectorLog(u) << endl; 
cout << "XMVectorExp(p) = " << XMVectorExp(p) << endl; 
cout << "XMVectorPpow(u, p) = " << XMVectorPow(u，p) << endl; 
cout << "XMVectorSqrt(u) = " << XMVectorSqrt(u) << endl; 


cout << "XMVectorSwizzle(uyu, 2, 2, 1, 3)=" 

<< XMVectorSwizzle(u, 2, 2, 1, 3) << endl; 
cout << "XMVectorSwizzle(uyu, 2, 1, 0, 3) = " 

<< XMVectorSwizzle(u, 2, 1, 68, 3) << endl; 


cout << "XMVectorMultiply(u, v) = " << XMVectorMultiply(u, v) << end 
1; 

cout << "XMVectorSaturate(q) = " << XMVectorSaturate(q) “< endl; 

cout << "XMVectorMin(p, v) = " << XMVectorMin(p, v) “< endl; 

cout << "XMVectorMax(p, v) = " << XMVectorMax(p, v) << endl; 

return 0; 


} 








i C\Windows\system32\cmd.exe 。 区 | 加 [| 
xMUectorAbs(vu) | 

ectorCos(w) 
xMUectorLog(u) 
xMUectorExp(lp) 


ectorSwizzle(Uu, 2, 
ectorSwizzle(U, 2, 


ectorMultiply(u, vu) 
XxMUectorSaturate( q) 

















图 1.22 上述 程 序 输出 的 结果 














[1] “ 询 ?的 对 应 英文 为 net， 大 抵 表 示 为 最 终 合 成 的 总 效果 ， 如 疤 方 回 
即 质点 在 不 同 力 的 作用 下 所 移动 的 方向 〈 也 就 是 这 几 个 作用 力 的 合力 方 
回 ) 。 后 文 同 。 








[2] 本 书 中 所 使 用 的 术语 “ 标 架 ”(frame) 、“ 人 参考 系 ”(frame of 


reference) 、“ 空 间 ”(space) 和 ?坐标 系 ”(coordinate system ) 缘 表 示 相 
同 的 意义 。 原作 和 证 





[3] 准确 地 说 还 应 考虑 到 气压 因素 。 


[4] 这 里 所 讲 的 都 是 推断 坐标 系 各 轴 大 致 方 回 的 办 法 ， 所 谓 “ 弯 曲 四 
指 ” 意 即 找寻 与 “弯曲 之 前 ”垂直 的 坐标 轴 。 下 同 。 





[5] ”上 毕 达 哥 拉 斯 定理 即 勾 股 定理 。 西 方 文 献 常 称 勾 股 定理 为 毕 达 哥 拉 斯 
定理 3 


[6] 看 到 normalize 这 个 词 的 各 种 译 法 就 让 我 咬牙 切 齿 ! 这 个 词 在 不 同 的 
学 科 里 有 痢 不 同 的 译 法 ， 就 算是 同一 学 科 的 不 同文 献 、 不 同 词典 的 译 法 
也 是 各 异 ， 如 标准 化 、 归 一 化 、 正 常 化、 规格 化 、 正 态 化 、 单 位 化 .…… 
而 且 现 在 各 种 讨论 中 大 多 是 统计 学 方面 的 ， 不 同人 给 出 的 解释 也 各 有 莽 
异 ， 刨 根 问 底 也 找 不 出 图 形 学 方面 的 译 法 。 这 就 与 “ 同 量 ”相似 ， 译 

作 “ 矢 量 ”* 也 可 ， 而 且 用 这 两 种 译 法 的 书籍 省 有 。 故 现 以 数学 文献 和 主流 
网 站 上 的 译 法 为 准 ， 基 本 上 称 区 间 、 范 围 为 “ 归 一 化 ”， 名 词 问 量 或 空间 
等 译作 “规范 化 ”"。 当 然 ， 也 有 我 水 平 不 足 之 嫌 。 写 这 段 话 的 目的 其 实 就 
是 希望 读者 不 要 过 分 拘泥 于 名 词 译 法 ,个 人 以 为 只 要 在 查看 各 种 文献 、 
与 他 人 交流 知道 彼此 在 谈 什么 即 可 ， 其 他 地 方 也 是 如 此 。 


























[7] DirectXMath.h 汰 文件 会 随 着 DirectXMath 库 版 本 的 更 新 而 变更 ， 因 
此 可 能 会 有 知 干 细节 与 读者 所 用 的 版 本 不 待 。DirectXMath 库 中 的 其 他 
文件 也 存在 这 种 情况 。 此 库 当 前 的 主要 维护 人 是 Chuck Walbourm。 读 者 
可 以 访问 Chuck WwWalbourn 的 博客 或 GitHub 网 站 以 获得 最 新 信息 。 

















[8] 私 以 为 平行 四 边 形 的 高 h 应 垂直 于 同 量 v。 


[9] 注意 XMVectorCos 函 数 的 输出 结果 。 


第 2 草 矩阵 代数 


在 计算 机 3D 图 形 学 中 ， 我 们 利用 矩阵 简洁 地 插 述 几何 体 的 变换 ， 
例如 缠 放 、 旋 转 和 平移 。 除 此 之 外 ， 还 可 借助 窍 阵 将 点 或 向 量 的 坐标 在 
不 同 的 标 架 之 间 进 行 转换 。 在 本 章 中 ， 我 们 将 探索 与 矩阵 有 关 的 数学 知 


从。 





学 习 目 标 : 

1. 理解 矩阵 及 其 相关 运算 的 定义 。 

2. 探 宛 为 何 能 将 问 量 与 沦 阵 的 乘法 视 为 一 种 线性 组 合 。 

3. 学 习 单 位 矩阵 、 转 置 矩 了 泗 、 行 列 式 以 及 矩阵 的 逆 等 概念 。 


4. 逐步 熟悉 DirectXMath 库 中 提供 的 关于 和 窍 阵 计算 的 类 与 函数 的 子 


2.1 和 矩阵 的 定义 


一 个 规模 为 mm x n 的 矩阵 (matrix) M， 是 由 mm 行 n 列 实数 所 构成 的 
和 矩形 阵列 。 由 行 数 和 列 数 的 乘积 表示 了 甜 阵 的 维度 。 和 矩阵 中 的 数字 则 称 
作 元 素 (element) 或 元 (entry) 。 通 过 双 下 标 表 示 法 Mij 指 定 元 素 的 行 
和 列 就 可 以 确定 出 对 应 的 矩阵 元 素 ，Mi 表 示 的 是 矩阵 中 第 ; 行 、 第 7 列 
的 元 又 。 








例 2. 1 
考察 下 列 窍 阵 : 

3.5 0 U 0 ] 

0 1 0 0 Bl Br 2 
4 一 是 一 Bal Bo v= 二 [ui1, Uo. U3| Dv 二 一 

(U U 0.: / 
.9 0 B B V3 

D _5 V3 ] 31 32 or 


1. A 是 一 个 4 x 4 和 拓 阵 ，B 是 一 个 3 x 2 箱 阵 ，v 是 一 个 1 x 3 知 阵 ，w 是 
一 个 4 x 1 矩阵 。 


2. 我 们 通过 双 下 标 表示 法 A442 =-5 将 矩阵 4 中 第 4 行 第 2 列 的 元 素 指 
定 为 -5， 并 以 Ba 表示 算 阵 B 中 第 2 行 第 1 列 的 这 一 元 素 。 


3.，zv 与 v 是 两 种 特殊 窍 阵 ， 分 别 只 由 一 行 元 素 或 一 列 元 率 构 成 。 由 
于 它们 第 用 于 以 矩阵 的 形式 来 表示 一 个 辐 量 〈 例 如 ， 我 们 可 以 自由 地 区 
蔡 使 用 (z, y, z) 与 [z, 网 引 这 两 种 问 量 记 法 ) ， 因 此 有 时 候 也 分 别称 它们 为 
行 问 量 或 列 癌 量 。 观 察 可 知 ， 在 表示 行 癌 量 和 列 回 量 的 窍 阵 元 素 时 不 必 


























在 茶 些 情况 下 ， 我 们 倾向 于 把 矩阵 的 每 一 行 都 看 作 一 个 向 量 。 例 
如 ， 可 以 把 矩阵 写作 : 


All! .412 413 
421 A 4o23| = 
43l A32 33 


其 中 ，41 = [A1, A12, A13], A2: = [21, A22, A23],， As,: = [A31, A32, 4a3|] 


。 在 这 种 表达 方式 中 ， 第 一 个 索引 表示 特定 的 行 ， 第 二 个 索引 “*” 表 示 
该 行 的 整个 行 回 量 。 而 且 ， 对 于 窍 阵 的 列 也 有 类 似 的 定义 : 


Al! .42 413 十 个 个 
421 A 423| 一 |141 4 A,; 
43l .43 A33 


上 “ 当 
了 4l1 .419 
4:1= |A21|, A,2= |42 | ， 
-431 A 


在 这 种 表达 方法 中 ， 第 二 个 索引 表示 特定 的 列 ， 第 一 个 索引 “*” 表 
示 该 列 的 整个 列 向 量 。 





《二 41*r 一 
4 一 Ao+ = 


CAs+ 一 

















现在 来 定义 矩阵 相等 、 加 法 运算 、 标 量 乘法 运算 和 减法 运算 。 








1. 两 个 矩阵 相等 ， 当 且 仪 当 这 两 个 矩阵 的 对 应 元 素 相 等 。 为 了 加 
以 比较 ， 两 者 必 有 相同 的 行 数 和 列 数 。 





2. 两 个 矩阵 的 加 法 运算 ， 即 将 两 者 对 应 的 元 素 相 加 。 同 理 ， 只 有 


行 数 和 列 数 都 分 别 相同 的 两 个 矩阵 相 加 才 有 意义 。 


3. 和 矩阵 的 标量 乘法 就 是 将 一 个 标量 依次 与 窍 阵 内 的 每 个 元 聚 相 


4. 利用 矩阵 的 加 法 和 标量 乘法 可 以 定义 出 矩阵 的 减法 ， 即 


A—B=A+(-1:B)= A+!(—B), 


例 2. 2 


设 
6 2 1 5 2 
| a | | ma 3 ,| 
那么 
] ) 6 2 1 十 6 十 2 1 1 

A+ | | : = | | 
(ii) 4 = Cr 

|2 1 -3|_ |132) 30) 3-3)| |6 3 -9 
Cy 6 3 0| 13(-6) 3(3) 3(0) | |-1l8 9 0 


1 5] 16 2 Es. -5 3 
ow -5-2 -BB -ls Co- 


由 于 在 矩阵 的 加 法 和 标量 乘法 的 运算 过 程 中 ， 是 以 元 素 为 单位 展开 











计算 的 ， 所 以 它们 实际 上 也 分 别 从 实数 运算 中 继承 了 下 列 性 质 : 


1. A+B=B+A 加 法 交换 律 

D. (A+B)+C=A+(B+CO) 加 法 结合 4 

3. rT(A+B)=rA+7B 标量 乘法 对 矩阵 加 法 的 分 配 
律 

4. (r+s)A=rA+sA 矩阵 乘法 对 标量 加 法 的 分 配 


2.2 ”矩阵 乘法 


2.2.1 定义 


如 果 A 是 一 个 m x n 窍 阵 ，B 是 一 个 n xP 答 阵 ， 那 么 ， 两 者 乘积 4B 
的 结果 是 一 个 规模 为 mW x P 的 第 阵 C。 箱 阵 C 中 第 ; 行 、 第 j 列 的 元 素 ， 由 
矩阵 4 的 第 i 个 行 回 量 与 矩阵 B 的 第 个 列 同 量 的 点 积 求 得 ， 即 : 


Oy= MAB (C1) 


要 注意 的 是 ， 为 了 使 算 阵 乘积 4B 有 意义 ， 冠 阵 4 中 的 列 数 与 矩阵 B 
中 的 行 数 必须 相同 。 也 就 是 说 ， 和 窍 阵 A 中 行 回 量 的 维 数 〈 可 认为 是 分 量 
的 个 数 ) 与 矩阵 BB 中 列 向 量 的 维 数 要 一 臻 。 如 果 二 者 的 维 数 不 同 ， 那 么 
式 《2.1) 中 的 点 积 运算 没有 意义 。 








例 2. 3 
设 

2 -6 

] 5 B= 1 3 

Se 攻 | 和 _3 0 


因为 矩阵 A 的 行 向量 维 数 为 2， 和 矩阵 B 的 列 同 量 维 数 为 3， 所 以 乘积 
AB 无 定义 。 不 妨 这 样 想 ， 由 于 2D 辣 量 不 能 与 3D 同 量 进行 点 积 计算 ， 因 
此 ， 和 矩阵 4 中 的 第 一 个 行 向 量 与 矩阵 B 中 的 第 一 个 列 向 量 也 束 无 法 开展 





由 于 和 窍 阵 A 的 列 数 与 矩阵 B 的 行 数 相 同 ， 可 首先 指出 乘积 4B 是 有 意 
义 的 《其 结果 是 一 个 2 x 3 矩阵 ) 。 根 据 式 〈2.1) 可 以 得 到 : 


| (一 15, 一 和 (2.0, 一 1 (—1,5,—4):(1,—2,2) (—1,5,— 4):(0,1,3) 
(3,2,1) : {2,0, — 1) (3,2,1): (1, 一 2.2) (3,2,1) : (0.,1,3) 


_ [2 -19 -7 
|5 1 5 


我 们 还 可 以 友 现 乘积 BA 却 没 有 意义 ， 因 为 窍 阵 B 的 列 数 不 等 于 和 矩 
阵 A 的 行 数 。 这 表明 ， 窍 阵 的 乘法 一 般 不 满足 交换 律 ， 妈 AB 了 BA4。 


2.2.2 ” 问 量 与 矩阵 的 乘法 
考虑 下 列 向 量 与 矩阵 的 乘法 运算 ， 


411 A12 413 
全 太一 [zz, 1/， Z| A A .423 | = [z, 1/ z| 
431 A3 A33 





可 以 观察 到 : 该 例 中 ，wA 的 计算 结果 是 一 个 规模 为 1 x 3 的 行 同 
。 现 在 运用 式 (2.1) 即 可 得 到 : 


地 ln 


uA = (wu ,1 UW- A.2 1 A,3| 


= [rzAl 十 YL421 + z431， TA 十 y.422 十 z432， TA13 十 y423 + zAa3] 
= [ZA11, TA12, TA13] + [yA21, YA22, YA23] + (2-31, z4a2，z4a33| 

= TA1, A12, A13] + VY [21, A22, A23 | + 2 [A31, -432, 433] 

= TIAl1;:+yA»,++ 2A;. 


因此 ， 


4 一 T41, 二 1V4 二 z43， (2.2) 


式 (2.2) 实 为 一 种 线性 组 合 (inear combination) ， 这 意味 着 向 量 
与 矩阵 的 乘积 v4 就 相当 于 : 问 量 wx 给 定 的 标量 系数 r、 兴 :与 矩阵 4 中 各 
行 回 量 的 线性 组 合 。 注 意 ， 尽 管 我 们 只 展示 了 1 x 3 行 向 量 与 3 x 3 矩阵 的 
乘法 ， 但 是 这 个 结论 却 具 有 一 般 性 。 也 就 是 说 ， 对 于 一 个 1 x n 行 问 量 w 


与 一 个 n x a 我 们 总 可 得 到 w 所 给 出 的 标量 系数 与 4 中 诸 行 问 量 
的 线性 组 合 uA 





All ci Alm 
也 = ,tn : 区 : = UAL: 十 十 tn， 


Ani < mn (2.3) 


92 结合 律 


算 阵 的 乘法 运算 具有 一 些 很 有 用 的 代数 性 质 。 例 如 ， 和 矩阵 乘法 对 逢 
阵 加 法 的 分 配 律 A\B+C)= AB+AC 以 及 (A4+B)C = AC+BC。 除 





此 之 外 ， 我 们 还 会 不 时 地 用 到 和 矩阵 乘法 的 结合 律 ， 可 借 此 来 决定 矩阵 乘 
法 的 计算 顺序 : 


(4BIC = 4(BC 


2.3 ” 转 置 矩阵 


转 置 下 阵 (transpose matrix) 指 的 是 将 原 窍 阵 的 行 与 列 进行 互 换 所 
得 到 的 新 矩阵 。 所 以 ， 根 据 一 个 m x n 和 矩阵 可 得 到 一 个 规模 为 n x m 的 转 
置 和 矩阵 。 我 们 将 和 矩阵 MI 的 转 置 矩阵 记 作 M7。 


例 2. 5 


求 出 下 列 3 个 窍 阵 的 转 置 矩阵 : 











转 置 矩阵 上 只 有 下 列 实用 性 质 : 
1. (A+B)'=A'+B’ 

2. (ch4) = cA 

3. (AB)' = BA’ 


4. (4°)=A 


. (A !) = ( 45)-1 


2.4 单位 矩阵 


时 位 距 阵 (identity matrix) 比较 特殊 ， 是 一 种 主 对 角 线 上 的 元 素 均 
为 1， 其 他 元 素 都 为 0 的 方 阵 。 


例如 ， 下 列 依次 是 规模 为 2 x 2，3 x 3 和 4 x 4 的 日 位 矩阵 : 


1000 

0 ! 
1 0 1 00 
) ; ; ) 
0 1 a 0 0 10 


000 1 





单位 和 矩阵 是 矩阵 的 乘法 单位 元 (multiplicative identity) 。 即 如 果 4 
为 m x n 窍 阵 ，B 为 % x 了 和 矩阵， 而 I 为 n x n 的 单位 矩阵 ， 那 么 


AI=AHIB=B 


换 名 话说， 任何 矩阵 与 单位 矩阵 相 乘 ， 得 到 的 依然 是 原 矩 阵 。 我 们 
可 以 将 单位 矩阵 看 作 是 矩阵 中 的 "数字 1"。 特 别 地 ， 如 果 M7 是 一 个 广 
阵 ， 那 么 它 与 单位 矩阵 的 乘法 满足 交换 律 ， 
MI=IM=M 


例 2.6 


w= | 1 和 1 ; 
设 ”以 及 ”中 ,证 明 MT = TVMT = MT。 


运用 式 (2.1) 得 : 


[2o0 [1,2):(1,0) (1,2): {0,1 
wo EY- 


0 4| 10 1 (0,4): (1,.0) (0.4) .1 
7 [1 01 2| |(1,0):(1,0) {1,0):(2,4)| |1 2 
En 1 | | 4 加 多 | 加 | 


所 以 MI = IM = M 是 正确 的 。 


例 2.7 


国 
下 了 一 » 
设 w = [-1, 2] 且 0 1 验证 wI = vw。 


应 用 式 (2.1) ? 可 得 : 
1 0 | Se ， 
ul 一 [一 1, 2] | =[(—1, 2). (1, 0)，(-1 2): (0, 1)] = [~1, 2] 


另外 可 以 看 出 ， 我 们 无 法 计算 乘积 Tu， 因为 此 矩阵 乘法 是 无 定义 
的 。 


2.5 和 矩阵 的 行列 式 


行列 式 是 一 种 特殊 的 函数 ， 它 以 一 个 方 阵 作 为 输入 ， 并 输出 一 个 实 
数 。 方 阵 4 的 行列 式 通 常 表示 为 det 4。 我 们 可 以 从 几何 的 角度 来 解释 行 
列 式 。 行 列 式 反映 了 在 线性 变换 下 ， 《za 维 多 面体 ) 体积 变化 的 相关 信 
息 外 。 男 外 ， 行 列 式 也 应 用 于 解 线性 方程 组 的 克 莱 姆 法 则 (Cramer’s 
Rule， 亦 称 元 莱 默 法 则 〉 。 然 而 ， 我 们 在 此 学 习 行 列 式 的 主要 目的 是 : 
利用 它 推 导出 求 首 矩阵 的 公式 〈 第 2.7 节 的 主题 )》 。 此 外 ， 行 列 式 还 可 
以 用 于 证 明 : 方 阵 4 是 可 逆 的 ， 当 且 仅 当 det 双关 0。 这 个 结论 很 实用 ， 
因为 它 为 我 们 确认 矩阵 的 可 道 性 提供 了 一 种 行 之 有 效 的 计算 工具 。 不 过 
在 定义 行列 式 之 前 ， 我 们 先 要 介绍 一 下 余子 阵 的 概念 。 





2.5.1 余子 阵 


指定 一 个 n x 7 的 矩阵 4， 余 子 阵 (minor matrix〉[314i. 即 为 从 A 中 
去 除 第 i 行 和 第 7 列 的 (7 一 x ta 一 了 矩阵。 


例 2. 8 
求 出 下 列 和 矩阵 的 余子 阵 4i1、4> 和 Als。 
d411 .42 A13 
4 一 1421 4 423 
Aal A30 了 433 





去 除 和 矩阵 4 的 第 一 行 和 第 一 列 ， 得 到 41 为 : 


2.5.2 ”行列 式 的 定义 


和 矩阵 的 行列 式 有 一 种 递归 定义 。 例 如 ， 一 个 4 x 4 矩阵 的 行列 式 要 根 

据 3 x 3 矩阵 的 行列 式 来 定义 ， 而 3 x 3 矩阵 的 行列 式 要 靠 2 x 2 矩阵 的 行列 

式 来 定义 ， 最 后 ，2 x 2 矩阵 的 行列 式 则 依赖 于 1 x 1] 矩阵 的 行列 式 来 定义 
(1 x ] 和 矩阵 4 = Lu 的 行列 式 被 简单 地 定义 为 detl4n] = 1) 。 


做 下 为 一 [nx n 和 矩阵 。 那么 ， 当 n > 1 时 ， 我 们 定义 : 


7 
三 (2.4) 


对 照 余子 阵 人 4j 的 定义 可 知 ， 对 于 2 x 2 矩阵 来 说 ， 其 相应 的 行列 式 


411 Al 
det 聊 pe 


:| = -44ll det [A422] 一 A12 det [421| = -A11422 — A12 21 
对 于 3 x 3 矩阵 来 说 ， 其 行列 式 计 算 公式 为 : 


411 A12 A13 
det | .421 A22 .4o23 


A3l A32 A33 
A A23 -21 A23 21 A 
= .4411 det — Ai» det A1s det 
和 际 Fa 人 S | 和 A32 
对 于 4 x 4 和 沧 阵 ， 其 行列 式 计算 公式 为 ; 
A Al Al3 AM 422 A 424 .4421 Az 
421 A .423 424 
det 4 4 4 4 = Aldet | 43 A33 .434 | 一 4 det | 431 A33 
pe W 39 pe WW pe W 
uel 442 As Au A A 


44 4 A Au 


421 A A A A 423 
+Ai3det | .431 43 .434 | 一 4d4det | A3l A32 A33 
A A Ay 441 A A 


在 3D 图 形 学 中 ， 主 要 使 用 4 x 4 矩阵 。 因 此， 我 们 不 再 继续 推导 
n > 4 的 行列 式 公 式 。 


全 2:9 


的 行列 式 。 


A24 
A34 
A 


A A23 A21 A23 A21 
det A = .41 det 一 4 det 十 413 det 
11 | 12 de b> 13 de ' pe 


det A = 2det EE 中 -Caas 区 | radet 攻 | 
三 
一 2(9) 十 5(15) 十 3(9) 
一 18 十 75 十 27 
= 120 


425 


2.6 伴随 矩阵 


设 4 为 一 个 n xn 矩阵。 乘积 C5 = (一 1 ”det 45 称 为 元 素 45 的 代数 
余子 式 〈cofactor of Aj) 。 如 果 为 矩阵 4 中 的 每 个 元 素 分 别 计算 出 C5， 
并 将 它 置 于 和 矩阵 C4 中 第 : 行 、 第 7 列 的 相应 位 置 ， 那 么 将 获得 算 阵 A 的 代 
数 余 子 式 和 矩阵 (cofactor matrix of 4) : 


C11 Cl … Cin 

Cal Co 7 Con 
4 三 -| . . | 

Cnl Cn2 2 Cnn 


若 取 和 矩阵 C4 的 转 置 矩 阵 ， 将 得 到 算 阵 A 的 伴随 矩阵 (adjoint matrix 
of A)， 记 作 : 


A*= 0 (OS) 


在 下 一 节 中 ， 我 们 将 学 习 利 用 带 有 伴随 矩阵 的 公式 来 计算 逆 和 矩阵 。 


2.7 ” 首 和 矩 阵 


矩阵 代数 不 存在 除法 运算 的 概念 向， 但 是 却 另 外 定义 了 一 种 矩阵 乘 
法 的 逆 运 算 。 下 面 总 结 了 与 扎 阵 逆 运 算 有 关 的 关键 信息 。 





1. 只 有 方 阵 才 具 有 逆 官 阵 。 因 此 ， 当 提 到 逆 甜 阵 时 ， 我 们 便 假 设 
要 处 理 的 是 一 个 方 阵 。 





2. n x7 和 矩阵 M 的 逆 也 是 一 个 n x n 窍 阵 ， 并 表示 为 M1!。 





3. 不 是 每 个 方 阵 都 有 逆 甜 阵 。 存 在 逆 算 阵 的 方 阵 称 为 可 逆 窍 阵 
(invertible matrix) ， 不 存在 逆 惩 阵 的 方 阵 称 作 奇 异 定 阵 〈singular 


matrix) 。 
4 可逆 和 矩阵 的 逆 和 矩阵 是 唯一 的 。 


5. 矩阵 与 其 逆 窍 阵 相 乘 将 得 到 单位 方 阵 : MM = MTIM = 工 
可 以 发 现 ， 和 矩阵 与 其 首 矩 阵 的 乘法 运算 满足 交换 律 。 


另外 ， 可 以 利用 道 和 矩阵 来 解 算 阵 方程 。 例 如 ， 设 矩阵 方程 Pp = PM 
， 且 己 知 P 与 M， 求 Pp。 假 设 矩 阵 M 是 可 道 的 ( 即 存在 M-!) ， 我 们 就 
能 解 得 P。 过 程 如 下 : 


p 一 DA 


PMT = PMA 方程 两 端 各 乘 以 M7 


pM pI 根据 可 道 矩 阵 的 定义 ， 有 MAM-: = 工 
pM '!'=p 根据 单位 矩阵 的 定义 ， 有 PI =Pp 


在 任何 一 本 大 学 水 平 的 线性 代数 教科 书 里 ， 都 可 以 找到 求 逆 矩阵 公 
式 的 推导 过 程 ， 这 里 也 束 不 再 殉 述 了 。 此 公式 由 原 矩 阵 的 伴随 矩阵 和 行 
列 式 构 成 : 


例 2. 10 


加 网 A12 


0 





3 0 
es 
”的 逆 和 矩阵 。 
己 知 
det A = A11 425 一 Al2 .421 
OC, (es ye det 411 (二 和 det A 到 42o 一 以 21 
ee 人 det Aul 人 det Aw —Al12 Aili 
因此 
; A’* CO 1 42 —Ai 
A = 一 一 一 一 
det 4 det 4 Al1 A 一 4424o21 一 村 21 A11 


3 0 


M -= 
现在 运用 此 公式 来 求 矩 阵 (re ey 


_ 1 20| /3 0 
ey | 加 是 和 a 


为 了 核实 结果 ， 我 们 来 验证 MM-!= M-!1M = 了 了 : 


-全 .94 


注 意 Note i 


对 于 规模 较 小 的 矩阵 (4 x 4 及 其 以 下 规模 的 矩阵 ) 来 说 ， 运 用 伴随 
和 矩阵 的 方法 将 得 到 不 错 的 计算 效率 。 但 针对 规模 更 大 的 矩阵 而 言 ， 就 要 
使 用 诸如 高 斯 消 元 法 (Gaussian elimination， 也 作 高 斯 消去 法 ) 等 其 他 
手段 。 由 于 我 们 关注 于 3D 计 算 机 图 形 学 中 所 涉及 的 具有 特殊 形式 的 息 
阵 ， 因 此 也 就 提前 确定 出 了 它们 的 求 逆 和 矩阵 公式 。 这 样 一 来 ， 我 们 便 无 
须 在 求 党 用 的 逆 和 矩阵 上 浪费 CPU 资 源 了 ， 继 而 也 就 极 少 会 在 代码 中 运用 
式 《26) ， 


我 们 以 下 列 “ 和 矩阵 乘积 的 逆 *” 这 一 实用 的 代数 性 质 ， 为 此 节 夯 上 名 
: 
(AB)'=B'A! 
该 性 质 假设 矩阵 4 与 矩阵 B 都 是 可 道 的 ， 而 且 皆 为 同 维 方 阵 。 为 了 
证 明 B-14-! 是 乘积 4B 的 逆 ， 我 们 必须 证 实 (4B)(B A") = 了 IT 以 及 


人 \ ) L | 干 
o 证 明 :; 
(AB : 一 一 一 
(B 1 
1\ z 
| 1 
1 
AA 1 
A J 


(B-!A 
= 
)(AB) 
)=B 
(4 
A'A)B=B 
一 1 
IB 
~ B-1B 
一 工 


2.8 用 DirectXMath 库 处 理气 阵 








为 了 对 点 与 同 量 进行 变换 ， 就 要 借助 1 x 4 行 同 量 以 及 4 x 4 矩阵 。 相 
关 原 因 将 在 下 一 章 中 细 述 。 目 前 ， 我 们 只 需 把 注意 力 集中 在 
DirectXMath 库 中 常用 于 表示 4 x 4 矩阵 的 数据 类 型 。 


2.8.1 ”和 矩阵 类 型 


DirectXMath 以 定义 在 DirectXMath.h 头 文件 中 的 XMMATRIX 类 来 表示 
4 x 4 和 矩阵 (为 了 叙述 清晰 起 见 ， 这 里 进行 了 若干 细节 上 的 调整 ) : 





#if (defined( M IX86) || defined( M x64) || defined( M ARM)) && 
defined(_ XM NO_INTRINSICS ) 

struct XMMATRIX 

#else 

__declspec(align(16)) struct XMMATRIX 


#endif 

{ 
// 利用 4 个 XMVECTOR 来 表示 算 阵 ， 借 此 使 用 SIMD 技 术 
XMVECTOR r[4]; 





























XMMATRIX() {} 


// 通过 指定 4 个 行 向 量 来 初始 化 矩阵 
XMMATRIX(FXMVECTOR RO@, FXMVECTOR R1, FXMVECTOR R2, CXMVECTOR R3) 
{ r[e] = RO; r[1] = R1; r[2] = R2; r[3] = R3; } 





// 通过 指定 16 个 矩阵 元 素来 初始 化 矩阵 
XMMATRIX(float m66，float mo61，float m62，float m83, 
float m16，float m11, float m12, float m13， 
float m260, float m21, float m22, float m23, 

float m306, float m31, float m32, float m33); 








// 通过 含有 16 个 浮 点 数 元 素 的 数组 来 初始 化 矩阵 
explicit XMMATRIX(_In reads (16) const float *pArray); 





XMMATRIX& 


{ r[e] = 


operator= (const XMMATRIX& M) 
M.r[e]; r[1] = M.r[1]; Fr[2] = M.r[2]; r[3] = M.r[3]; 


return *this; } 


XMMATRIX 
XMMATRIX 


XMMATRIX& 
XMMATRIX& 
XMMATRIX& 
XMMATRIX& 
XMMATRIX& 


XMMATRIX 
XMMATRIX 
XMMATRIX 
XMMATRIX 
XMMATRIX 


operator+ () const { return *this; } 
operator- () const; 


XM CALLCONV operator+= (FXMMATRIX M); 
XM CALLCONV operator-= (FXMMATRIX M); 
XM CALLCONV operator*= (FXMMATRIX M); 
operator*= (float S); 
operator/= (float S); 


XM CALLCONV operator+ (FXMMATRIX M) const; 
XM CALLCONV operator- (FXMMATRIX M) const; 
XM CALLCONV operator* (FXMMATRIX M) const; 
operator* (float S) const; 
operator/ (float S) const; 


friend XMMATRIX XM CALLCONV operator* (float S, FXMMATRIX M); 





综 上 所 述 ，XMMATRIX 由 4 个 XMVECTOR 实 例 所 构成 ， 并 借 此 来 使 用 


SIMD 技 术 。 


此 外 ，XMMATRIX 类 还 为 矩阵 计算 提供 了 多 种 重 载 运算 符 。 


除了 各 种 构造 方法 之 外 ， 还 可 以 使 用 XMMatrixSset 函 数 来 创建 
XMMATRIX 实 例 : 


XMMATRIX XM CALLCONV XMMatrixSet( 


float mooe, 
float mig, 
float m208, 
float m308, 


就 像 通过 XMFLOAT2 (2D)，XMFLOAT3 (3D) 和 XMFLOAT4 (4D) 来 存储 


float mo1，float mo62， 


float m11, float m12， 
float m21, float m22, 
float m31, float m32, 





类 中 不 同 维度 的 向 量 一 样 ，DirectXMath 文 档 也 建议 我 们 用 XMFLOAT4X4 
来 存储 类 中 的 矩阵 类 型 数据 成 员 。 


struct XMFLOAT4X4 
{ 
union 
{ 
struct 
{ 
float 11, 12, 13, _ 
float 21, 22, 23, _ 
float 31, 32, 33，_ 
float 41, 42, 43, _ 
}; 
float m[4][4]; 
}; 


XMFLOAT4X4() {} 

XMFLOAT4X4(float me6, float me1, float m02, float m83, 
float m16, float m11, float m12, float m13, 
float m260, float m21, float m22, float m23, 
float m36, float m31, float m32, float m33); 

explicit XMFLOAT4X4(_In reads (16) const float *pArray); 


float operator() (size t Row, size t Column) const { return m[Row][Co 
lumn]; } 
float& operator() (size t Row, size t Column) { return m[Row][Column]; 


} 


XMFLOAT4X4& operator=(const XMFLOAT4X4& Float4x4); 
}; 





通过 下 列 方 法 将 数据 从 XMFLOAT4X4 内 加 载 到 XMMATRIX 中 : 


inline XMMATRIX XM CALLCONV 
XMLoadFloat4x4(const XMFLOAT4X4* pSource); 


通过 下 列 方 法 将 数据 从 XMMATRIX 内 存储 到 XMFLOAT4X4 中 : 


inline void XM CALLCONV 
XMStoreFloat4x4(XMFLOAT4X4* pDestination, FXMMATRIX M); 


2.8.2 ”和 矩阵 函数 


DirectXMath 库 包含 了 下 列 与 算 阵 相关 的 实用 函数 : 











XMMATRIX XM _CALLCONV XMMatrixIdentity();  // 返回 单位 矩阵 I 

















bool XM CALLCONV XMMatrixIsIdentity( // 如 果 M 是 单位 矩阵 则 返回 
FXMMATRIX M) ; // 输入 矩阵 M 





XMMATRIX XM_CALLCONV XMMatrixMultiply( // 返回 矩阵 乘积 AB 
FXMMATRIX A， // 输入 矩阵 A 
CXMMATRIX B); // 输入 矩阵 B 











XMMATRIX XM CALLCONV XMMatrixTranspose( // 返回 MT 





FXMMATRIX M); // 输入 矩阵 M 











XMVECTOR XM CALLCONV XMMatrixDeterminant( // 返回 (det M, det M, det M, de 
t M) 
FXMMATRIX M); // 输入 矩阵 M 








XMMATRIX XM_CALLCONV XMMatrixInverse( // 返回 Mi 
XMVECTOR* pDeterminant, // 输入 (det M, det M, det M，de 
t M) 
FXMMATRIX M); // 输入 矩阵 M 














在 声明 具有 XMMATRIX 人 参数 的 函数 时 ， 除 了 要 注意 1 个 XMMATRIX 应 
计 作 4 个 XMVECTOR 参 数 这 一 点 之 外 ， 其 他 的 规则 与 传 入 XMVECTOR 类 型 
的 参数 时 《〈 见 1.6.3 节 ) 相 一 致 。 假 设 传 入 函数 的 FXMVECTOR 参 数 不 超 过 
两 个 ， 则 第 一 个 XMMATRIX 参 数 应 当 为 FXMMATRIX 类 型 ， 其 余 的 
XMMATRIX 参 数 均 应 为 CXMMATRIX 类 型 。 下 面 的 代码 展示 了 在 32 位 
Windows 平 台 和 编译 器 (编译 器 需 支 持 _ fastcall 以 及 新 增 的 
_Vvectorcal1 调 用 约定 ) 的 环境 下 ， 这 些 类 型 的 定义 : 








// 在 32 位 的 Windows 系 统 上 ，__fastcall 调 用 约定 通过 寄存 器 传递 前 3 个 XMVECTOR 参 数 ， 


其 余 的 

// 参 数 则 存在 堆栈 上 

typedef const XMMATRIX& FXMMATRIX; 
typedef const XMMATRIX& CXMMATRIX; 











// 在 32 位 的 Nindows 系 统 上 ，_ vectorcal1 调 用 约定 通过 寄存 器 传递 前 6 个 XMVECTOR 实 


参 ， 其 余 的 

// 参数 则 存在 堆栈 上 

typedef const XMMATRIX FXMMATRIX; 
typedef const XMMATRIX& CXMMATRIX; 








可 以 看 出 ， 在 32 位 Windows 操 作 系 统 上 的 _ fastcal1 调 用 约定 
中 ，XMMATRIX 类 型 的 参数 是 不 能 传 至 SSE/SSE2 寄 存 器 的 ， 因 为 这 些 寄 
存 右 此 时 只 支持 3 个 XMVECTOR 参 数 传 入 。 而 XMMATRIX 参 数 却 是 由 4 
个 XMVECTOR 构 成 ， 所 以 矩阵 类 型 的 数据 只 能 通过 堆栈 来 加 以 引用 。 至 
于 这 些 类 型 在 其 他 平台 上 的 定义 详情 ， 可 见 DirectXMath 文 档 
[DirectXMath] 中 “Library Internals”(〈 库 的 内 部 细节 ) 下 的 “Calling 
Conventions”( 调 用 约定 ) 部 分 。 构 造 函 数 方法 对 于 这 些 规则 来 说 是 一 
个 特例 。[DirectXMath] 建 议 用 户 总 是 在 构造 函数 中 采用 CXMMATRIX 类 型 
来 获取 XMMATRIX 人 参数 ， 而 且 对 于 构造 函数 也 不 要 使 用 XM_CALLCONYV 约 
定 注 解 。 


2.8.3 ”DirectXMath 算 阵 示 例 程序 


下 列 代码 提供 了 一 些 XMMATRIX 类 的 使 用 范例 ， 其 中 包括 了 上 一 小 
市 中 介绍 的 大 多 数 函 数 。 





#include <windows.h> // 为 了 使 XMVerifyCPUSupport 函 数 返 回 正确 值 
#include “DirectXMath .hy> 

#include <DirectXPackedVector.h> 

#include <iostream> 

using namespace std; 

using namespace DirectX; 

using namespace DirectX: :PackedVector; 














// 重 载 "<<" 运 算 符 ， 这 样 就 可 以 利用 cout 输 出 XMVECTOR 和 XMMATRIX 对 象 
ostream& XM CALLCONV operator << (ostream& os, FXMVECTOR v) 


{ 


W 


} 


XMFLOAT4 dest; 
XMStoreFloat4(&dest, v); 


os << "(" <x< dest.x 《< ",， << dest.y “< "， << dest.z << ",， 


<< 


LL 
了 


return os; 


ostream& XM CALLCONV operator 《< (ostream& os, FXMMATRIX m) 


{ 


} 


int main() 


{ 


for (int i = 6; i < 4; ++i) 


{ 


OS 
OS 
OS 
OS 
OS 


} 


<< 
<< 
<< 
<< 
<< 


XMVectorGetXx(m.r[i]) << "\t"; 
XMVectorGetY(m.r[i]) << "\t"; 
XMVectorGetZz(m.r[i]) << "\t"; 
XMVectorGetw(m.r[i]); 

endl; 


return os; 


// 检查 是 否 支 持 SSE2 指 令 集 (Pentium4，AMD K8 及 
































后 续 版 本 的 处 理 器 ) 








、 











if (!XMVerifyCPUSupport()) 


{ 


cout << "directx math not supported" << endl; 
return 0; 


} 


XMMATRIX 


XMMATRIX 
XMMATRIX 


XMMATRIX 


XMVECTOR 
XMMATRIX 


XMMATRIX 


cout 


<< 


A(1.06f, 0.0f, 60.06f, 0.6f, 
6.6f，2.6f，6.6f，68.6f， 
6.6f，6.6f，4.6f，68.6f， 
1.6f，2.6f，3.6f，1.6f); 


B = XMMatrixIdentity(); 
C=A* B; 


D = XMMatrixTranspose(A); 


det = XMMatrixDeterminant(A); 
E = XMMatrixInverse(&det, A); 


F =A*E; 


"A=" <x< endl < A endl; 


<< 


dest. 


cout << "B= " << endl < B<< endl; 


cout << "C= A*B = "< endl < C <x< endl; 

cout << "D = transpose(A) " xx endl << D << endl; 

cout << "det = determinant(A) = " << det << endl << endl; 
cout << "E = inverse(A) " << endl << E << endl; 

cout << "F = A*E = "< endl < F << endl; 

return 0; 





述 范 例 程序 的 输出 结果 如 图 2.1 所 示 。 





本 C\Windows\system32\cmd.exe Le | 名 | 


=: determinant(A) = (8, 
inverse(A) := 

0 

0.5 

0 


= 


9 
1 
[0] 
0 





Press any key to continue . 











图 2.1 ”范例 程序 输出 的 结果 





2.9 小结 


1. m x n 第 阵 M 是 一 个 由 mm 行 n 列 实数 所 构成 的 矩形 阵列 。 两 个 同 
维和 矩阵 相等 ， 当 且 仅 当 它 们 对 应 的 元 素 分 别 相等 。 两 个 同 维和 矩阵 的 加 法 
运算 ， 由 这 两 个 矩阵 对 应 的 元 素 相 加 来 实现 。 标 量 与 矩阵 的 乘法 运算 是 
将 标量 与 矩阵 中 的 每 个 元 素 分 别 相 乘 。 

















2. 如 果 A 是 一 个 m x n 逢 了 泗 ， 且 B 为 一 个 nx Pp 矩阵 ， 那 么 两 者 乘积 
AB 的 结果 是 一 个 规模 为 m x Pp 的 矩阵 C。 和 矩阵 C 中 第 行 、 第 j 列 的 元 素 ， 
由 和 矩阵 4 中 的 第 ;个 行 向 量 与 矩阵 互 中 的 第 7 个 列 向 量 进 行 点 积 运算 得 
出 ， 即 Cy = 4 Bj, 





3. 矩阵 乘法 不 满足 交换 律 ( 即 一 般 来 说 ，4B 取 BA4) ， 但 是 却 满 
足 结合 律 (4BI)C 一 At 已 C)。 





4. 转 置 矩阵 由 原 和 矩阵 互 换行 与 列 来 求 得 。 所 以 ， mm x n 和 矩阵 的 转 置 
矩阵 为 x m 和 矩阵 。 我 们 将 矩阵 MM 的 转 置 算 阵 表 示 为 M7。 


5. 单位 矩阵 是 一 种 除 主 对 角 线 上 的 元 素 为 1 外， 其 他 元 素 均 为 0 的 
方 阵 。 


6. 行列 式 det A 是 一 种 特殊 的 函数 ， 向 它 传 入 一 个 方 阵 便 会 计算 出 
一 个 对 应 的 实数 。 方 阵 4 是 可 逆 的 ， 当 且 仅 当 det 4 去 0。 行列 式 常常 用 
于 计算 逆 和 矩阵 。 








7. 和 矩阵 与 其 逆 和 矩阵 的 乘积 结果 为 单位 和 矩阵， 即 
MM = M !M = I。 如 果 一 个 算 阵 是 可 逆 的 ， 则 此 和 矩阵 的 逆 窍 阵 是 
唯一 的 。 只 有 方 阵 才 可 能 有 道 和 矩阵， 即便 是 方 阵 也 未 必 可 道 。 逆 矩阵 可 
由 公式 4 ”= 4A“/ det 4 来 计算 ， 其 中 4 是 伴随 矩阵 〈 即 矩阵 4 的 代数 余 
子 式 矩 阵 的 转 置 矩阵 ) 。 


8. 我 们 在 编写 代码 时 ， 用 DirectXMath 中 的 XMMATRIX 类 型 来 表示 
4 x 4 矩阵 ， 以 此 来 发 挥 SIMD 技 术 高 效 的 运算 能 力 。 但 对 于 类 中 的 数据 
成 员 ， 我 们 则 要 以 XMFLOAT4X4 类 型 来 加 以 表示 ， 并 通过 加 载 
(XMLoadFloat4x4) 和 存储 (XMStoreFloat4x4) 方法 ， 使 数据 
在 XMMATRIX 类 型 与 XMFLOAT4X4 类 型 之 间 互 相 转 换 。XMMATRIX 类 重 载 
了 一 些 算数 运算 符 ， 使 矩阵 可 以 实现 加 法 运算 、 减 法 运算 、 和 矩阵 乘法 运 
算 和 标量 乘法 运算 。 此 外 ，DirectXMath 库 还 提供 了 下 列 实用 的 矩阵 函 
数 ， 用 于 计算 单位 矩阵 、 和 矩阵 乘积 、 转 置 算 了 泗 、 行 列 式 以 及 逆 和 矩阵: 


XMMATRIX XM CALLCONV XMMatrixIdentity(); 
XMMATRIX XM CALLCONV XMMatrixMultiply(FXMMATRIX A, CXMMATRIX B); 
XMMATRIX XM 


CALLCONV XMMatrixTranspose(FXMMATRIX M); 

XMVECTOR XM CALLCONV XMMatrixDeterminant(FXMMATRIX M); 

XMMATRIX XM CALLCONV XMMatrixInverse(XMVECTOR* pDeterminant, 
FXMMATRIX M); 





2.10 


CD 


人 


练习 


.求解 下 列 矩 阵 方程 中 的 矩阵 X; {| | -2x) =2[ . 


. 计算 下 列 和 矩阵 的 乘积 : 
2 一 1 

—2 0 3 . 

0 6 

1 —1 ， 
(a) |. | ! | 


.计算 下 列 矩 阵 的 转 置 矩阵 ; 


(a) [1, 2, 3 


| 
(b) 之 UW 


1 2 
3 4 
5 6 
(c) L 3 


将 下 列 线性 组 合 写 作 同 量 与 矩阵 乘积 的 形式 : 


(a) v= 2(1,2,3)— 4(—5,0,—1) 十 3(2, 一 2,3) 


(b) v2 = 3(2,—4)+2(1,4)—1(—2,—3) + 5(1,1) 


5. 证 明 
411 42 Aji3 B11 B12 B13 CAI.BO 
AB= |A 4 An| 1Bo Bo Ba|=| 夺 A..B 
Aal A3 A33| |B3l Ba B33 A3.B 

6. 证 明 


All .412 .413 
Au = |.421 A 2423 
4al As2p As3 


二 工人 ,1 十 YA.» 十 Z4,3 


性 





7. 证 明 向 量 的 又 积 可 以 用 和 矩阵 的 乘积 来 表示 : 


0 U: —Uy 
wu xv= [Vv] |—u: 0 Ur 
Uy  —Uz 0 


0 “小 那么 请问 矩 阵 


9 9 1 韦 4 的 逆 矩 阵 吗 ? 


1 2 


| 
9. 设 矩 阵 4 习 ， 那 么 ， 请 问 和 矩阵 
阵 吗 ? 


| 
人 
< 
下 [ew 
t 
Se 


1 i 


0. 求 下 列 矩阵 的 行列 式 : 


21 一 4 
| 和 


1. 求 下 列 矩 阵 的 逆 窍 阵 : 
21 一 4 
Fe 


2. 下 列 矩 阵 是 可 逆 矩 阵 吗 ? 


~ 


2 0 0 
0 3 0 
人 
2 0 0 
0 3 0 
0 0 7 


一 





一 


| 
OO 
品 心 局 
Ow 
| 


3. 假设 矩阵 A 是 可 逆 矩 阵 ， 证 明 (4 ) ”= (4") 。 


~ 


一 


4. 所 有 的 线性 代数 书籍 都 会 证 明 det(AB) = det 4 .det B 这 一 性 
质 。 设 A 和 BB 丝 为 n xz 矩阵， 并 假设 4 是 可 逆 的 ， 试 根据 detT = 1 与 上 述 
1 


udet A l= 一- 
性 质 来 证 明 “… GA 


Os 
量 ? = (wz,%) 张 成 的 平行 四 边 形 的 有 向 面积 。 如 果 向 量 u 以 逆 时 针 方 向 族 
转角 9 < (0. 7) 能 与 向 量 v 重 合 ， 则 结果 为 正 ， 否 则 为 负 。 





16. 求 由 下 列 癌 量 张 成 的 平行 四 边 形 面 积 : 
(ay w= (3,0)v = (1,1) 


(by w= (1,—1)v = {0,1) 


.411 A12 B11! B12 C11 C12 
将 三 oe ee 
17. 设 A21 A Br B22| 日 C21 C2|]。 证明 


AlBC) = 【4B)C。 这 个 结论 说 明了 2 x 2 算 阵 之 间 的 乘法 运算 满足 结合 
律 。 (事实 上 ， 只 要 和 矩 阵 的 乘法 有 意义 ， 任 意 规模 的 矩阵 乘法 部 满足 结 
合 律 # 》 


18. 编写 一 个 计算 机 程序 ， 使 之 在 不 借助 DirectXMath 库 的 情况 下 
( 仅 用 C++ 中 的 二 维 数组 〈array of arrays) ) 就 可 以 计算 m xz 和 矩阵 的 转 
置 矩 阵 。 


19. 编写 一 个 计算 机 程序 ， 在 不 使 用 DirectXMath 库 的 情况 下 〈 仅 
用 C++ 中 的 二 维 数组 ) ， 使 它 可 以 计算 出 4 x 4 矩阵 的 行列 式 及 其 逆 拖 
阵 。 


[准确 来 讲 ， 和 矩阵 中 的 元 素 并 非 仅 为 实数 。 


[2] 这 个 定义 并 不 十 分 准确 。 例 如 ， 在 二 维 情况 的 线性 变换 下 ， 二 阶 行 
列 式 反映 的 是 平行 四 边 形 有 癌 面 积 的 变化 。 参 见 本 章 练习 15。 


[3] 这 一 小 节 中 的 部 分 数学 术语 在 不 同 的 文献 中 会 有 些 差 别 ， 此 处 以 常 
见 文 献 中 的 译 法 为 主 。 读 者 应 以 具体 的 定义 为 准 。 


[4] 可 参见 22.2.6 节 。 


第 3 革 ”变换 


通过 将 一 系列 三 角形 拼接 在 一 起 即 可 近似 地 表示 物体 的 外 表面 ， 我 
们 借助 这 种 几何 方式 来 描述 3D 空 间 内 的 物体 。 但 仅 有 静止 物体 的 场景 
是 索然 无 味 的 ， 所 以 我 们 将 把 兴致 放 在 探求 几何 体 变 换 的 方法 之 上 ， 如 
平移 、 旋 转 和 缩放 这 几 种 常见 的 几何 变换 。 在 本 章 中 ， 我 们 将 推导 用 于 
在 3D 空 间 里 对 点 和 疝 量 进 行 变换 的 矩阵 方程 。 














学 习 目 标 : 





1. 理解 如 何 用 窍 阵 表示 线性 变换 和 念 射 变换 。 


2. 学 习 对 几何 体 进行 缩放 、 旋 转 和 和 平移 的 坐标 变换 。 


3. 根据 矩阵 之 间 的 乘法 运算 性 质 ， 将 多 个 变换 窍 阵 合并 为 一 个 单 
独 的 滔 变 换 矩 阵 。 


4. 找寻 不 同 坐 标 系 之 间 的 坐标 转换 方法 ， 并 利用 矩阵 来 表示 此 坐 
标 变 换 。 


5. 测 臣 DirectXMath 库 专 为 构建 变换 矩阵 所 提供 的 相关 函数 。 


3.1 线性 变换 


3.1.1 定义 


先 来 研究 一 下 数学 函数 7(v) = T(z,y,2) = (ZT,Y,z)。 此 函数 的 输入 和 
输出 都 是 3D 回 量 。 我 们 称 z 为 线性 变换 (inear transformation) ， 当 且 
仅 当 此 函数 具有 下 列 性 质 : 


T(t ov) 一 TU) 十 TD) 


Tku) = kT(u) (3.1) 


其 中 ，% = twuz, wy) 和 v= (Vz,Vy,V:) 是 任意 3D 向 量 ,为 一 个 标 


注 意 Note 


非 3D 疝 量 亦 可 作为 线性 变换 的 输入 和 输出 ， 但 是 在 有 关 3D 图 形 学 
相关 的 书籍 中 往往 不 会 讨论 这 种 一 般 情况 。 








例 3.1 


定义 函数 T(z,y,2) = (z 帮 汐 ， 例 如 rll;2,3) = (1,4,9)。 这 个 函数 是 


非 线 性 函数 ， 因 为 当 k = 2 且 = (1,2,3) 时 ， 有 
rT(ku) = 7(2,4,6) = (4, 16, 36) 
但 
kT(u) = 2(1,4,9) = (2, 8, 18) 


因此 ， 该 函数 不 满足 式 (3.1) 中 的 第 二 条 性 质 。 


如 果 7 是 线性 函数 ， 那 么 有 


T(aw + bv + cw) = Tau + (b+ cw)) 
= aT(w) +T(bv + cw) 
一 aT(U) + bT(v) 十 cTlz0| (3.2) 


我 们 在 下 一 小 节 中 将 用 到 这 个 绪论 。 


3.1.2 证 阵 表 示 法 


设 4 = (7,y, >)， 我 们 也 可 以 将 它 写 作 
w= (TY,2) = T+YI + k= 7(1,0,0)+ vy(0,1,0) + 2z(0,0,1) 
i 二 (1,0,0),7 = (0,1,0) 和 k = (0,0,1) 分 别 表 示 位 于 当前 坐标 轴 正 方向 
上 的 3 个 单位 向 量 ， 我 们 称 之 为 R*(R3 表 示 所 有 3D 坐 标 向 量 (z, y, z) 的 集 


合 ) 的 标准 基 向 量 (standard basis vector) 。 现 假设 7 是 一 种 线性 变换 ， 
根据 它 的 线性 性 质 〈 即 式 〈3.2) ) ， 能 够 得 到 


Ta = TT YI + 2k) 一 ZTE) 十 VT(I) + 2zT(k) (3.3) 


可 以 看 出 ， 这 个 公式 其 实 就 是 我 们 在 上 一 章 中 学 到 的 线性 组 合 ， 可 
将 其 表示 为 回 量 与 矩阵 的 乘积 。 根 据 式 (2.2〉 ， 我 们 可 以 将 式 (3.3) 
改写 作 


其 中 7 (A11, A12, A13), 7T(7) = (A421, A2, 423) 目 TCR) = (A31, A32, A33) 
。 我 们 称 和 矩阵 4 是 线性 变换 7 的 矩阵 表示 法 。 


3.1.3 ”缩放 
缩放 〈scaling， 也 有 译作 比例 变换 ) 是 指 改变 物体 的 大 小 ， 其 变换 
效果 如 图 3.1 所 示 。 
我 们 把 缩放 变换 定义 为 
S(T,Y,2) = (sz7,syy, 5:2) 


此 变换 将 相对 于 当前 坐标 系 中 的 原点 ， 令 回 量 在 z、Yy、z 轴 上 分 别 
以 系数 sz、5%、s: 进 行 缩放 。 下 面 我 们 来 证 明 Ss 其 实 就 是 一 种 线性 变换 : 


S(U + Vv) 一 (srltz 十 Vz), st 十 Vy) 5. (uu. + v.)) 


一 (sztz + szVz; Syly + SyvVy, ss 十 82V:) 


= (srUz, SyUy, SU: ) + (szrvz, SyUy, 5: U.) 


= (了 1) 十 9017) 
(KU ) = (srkuzr, syhuy,, s: Ku. ) 


= k(sruzr, Syuy, S-1- ) 


















































图 3.1 左 侧 的 兵 是 未 经 变换 的 原始 物体 ， 中 间 的 兵 是 把 原始 的 兵 在 Y 轴 方向 伸 长 2 倍 后 
“增高 ”的 效果 ， 右 侧 的 兵 是 将 原始 的 兵 在 Z 轴 方向 掉 宽 2 倍 后 “ 增 肥 ”的 效果 



































因此 ， 缩 放 变 换 5 满 足 式 〈3.1) 中 的 所 有 性 质 。 这 就 是 说 ，5 是 线 
性 变换 并 存在 一 种 矩阵 表示 法 。 为 了 求 出 5s 的 矩阵 表示 ， 我 们 只 需 像 式 
(3.3) 那样 ， 把 每 一 个 标准 基 向 量 依次 代入 S， 再 将 得 到 的 向 量 作为 矩 
阵 的 行 回 量 ( 计 算 过 程 如 式 (3.4) ) 。 





S(i) = (sr:1, sy:0,s::0)= {sr,0,0) 
S(7)= (sr:0,s,:1,s.:0)= (0, s,,0) 
SIE) = (oz:0, 8 0 81) = (0, 0 32) 


I Vy 


这 样 束 得 到 了 缩放 变换 5 的 窍 阵 表示 


sr 0 0 
S= |10 s, 0 
0 0 s. 


我 们 称 此 和 矩阵 为 缩放 和 矩阵 (scaling matrix， 亦 有 译 为 比例 变换 和 矩 
阵 ) 。 


而 其 对 应 的 逆 窍 阵 则 为 


l/st 0 0 
Sl!=|0 1/s 0 
0 0 1 / S- 


假设 定义 了 一 个 最 小 点 坐标 为 (-4, -4, 0) 和 最 大 点 坐标 为 (4, 4, 0) 的 
正方 形 。 现 欲 将 此 正方 形 在 z 轴 方向 上 缩小 50%， 在 y 轴 方向 上 放大 2.0 
音 ， 但 在 : 轴 方 向 上 保持 不 变 。 其 对 应 的 缩放 矩阵 为 


0.5 0 0 
S=|10 2 0 
0 0 1| 


此 时 ， 若 要 对 该 正方 形 进 行 缩放 变换 ) ， 只 需 将 其 最 小 点 、 最 大 
点 坐标 分 别 与 缩放 矩阵 相 乘 即 可 : 


0.5 0 0 0.5 0 0 
[-4 -40|0 20| =[-2 -80 [4,4,0|10 20| = 
0 0 1 0 0 1 


[2, 8, 0] 


例 3.2 








变换 的 效果 如 图 3.2 所 示 。 


+Y 缩放 vy 
(2, 8,0) 


(4,4,0) 








(—4,—4,0) 








(~2,—8, 0) 
Y 








图 3.2 ”将 例 3.2 中 的 图 像 在 z 轴 方向 缩小 为 起 始 的 50%、 在 7 负 方 向 放大 为 起 始 的 两 倍 后 的 效果 。 
注意 ， 在 沿 z 轴 负 方 向 观察 的 时 候 ， 由 于 z = 0， 所 以 几何 体 看 上 去 是 2D 效 果 [] 



































3.1.4 旋转 


在 本 节 中 ， 我 们 将 用 数学 的 方式 来 搬 述 令 向 量 v 绕 轴 n 以 角 9 进 行 旋 
转 ， 此 过 程 如 图 3.3 所 示 。 注 意 ， 在 沿 n 轴 从 上 至 下 俯 且 时， 我 们 按 顺 时 
针 方向 来 测量 角 9， 并 且 假 设 I?|| = 1。 





首先 ， 将 向量 v 分 解 为 两 部 分 ， 一 部 分 平行 于 n， 男 一 部 分 正 交 于 n 
。 平行 于 n 的 部 分 即 为 Projn(v) (参见 第 1 章 中 的 例 1.5〉， 正 交 于 n 的 部 
分 则 是 ?1 = Perpn(?) 二 2 一 Projn(v)( 同 见 例 1.5， 由 于 nn 是 单位 向 量 ， 我 
们 就 可 以 得 到 Projn(v) = (nv)n) 。 观 察 示意 图 能 够 发 现 这 样 一 个 关键 
信息 : 平行 于 n 的 部 分 Projntv?) 在 旋转 时 是 保持 不 变 的 。 因 此 ， 我 们 只 需 















(V) 


vy -PO | 
ee 
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图 3.3 令 向 量 绕 轴 4 旋转 的 几何 关系 示意 图 








为 了 求 出 (v1)， 我 们 在 旋转 平面 内 建立 一 个 2D 坐 标 系 ， 并 将 v1 作 
为 一 个 参考 向 量 。 通 过 计算 又 积 n x wv 来 获得 既 正 交 于 v1 又 正 交 于 n 的 第 
二 个 参考 向 量 〈 根 据 左 手 拇指 法 则 ) 。 基 于 图 3.3 所 示 的 三 角 关系 和 第 1 
章 练习 14 所 得 到 的 结论 可 知 : 








Ir xv|| = | 有 ollsina= ollsnaa= |lv 








其 中 ，a 是 mm 与 v 之 间 的 夹 角 。 由 此 可 知 : 两 个 参考 向 量 的 长 度 相 
等 ， 且 都 位 于 旋转 的 圆周 之 上 。 根 据 三 角 学 知识 ， 我 们 就 可 以 将 这 两 个 
参考 向 量 建立 如 下 关系 : 

Rn(v1)= cosOv +sino(n x wv) 

这 样 就 推导 出 了 下 列 旋 转 公 式 : 


Rn(v) = projn(v) + Rn(v1) 


= (nv)n+cosOv +sinon x wv) 
一 (7 .0 十 cosglu oo (nvn)+t+sinon x wv) 
一 cosgu 十 1 一 cosg) 人 mVD)m 二 Sing x wv) (3.5) 


我 们 把 证 明 此 公式 是 一 种 线性 变换 的 任务 留 作 章 末 的 习题 。 硝 要 得 





到 旋转 的 变换 窍 阵 表示 ， 仅 需 按 式 〈3.3) 那样 将 各 个 标准 基 回 量 代 入 
到 台中， 再 把 得 到 的 癌 量 分 别 作为 矩阵 的 行 癌 量 〈《 见 式 〈3.4) ) 。 最 
终 得 到 的 结果 为 : 


c 十 (1 一 c)r (1 —c)ryt+sz (ll—c)rz— sy 
Rn= |I(l—c)ry—sz c+l(l— cj (1 — c)yz 十 ST 
(1—c)rz+sy (1 一 cjyz 一 sST c+({(l— C)z2 
此 处 设 c ~ cos8Hs = sing。 


旋转 生 阵 有 个 有 下 的 性 质 ， 每 个 行 向 量 都 为 单位 长 度 且 两 两 正 交 





(请 分 别 证 明 )〉 。 也 就 是 说 ， 这 些 行 向 量 都 是 规范 正 交 的 
(orthonormal， 即 互相 正 交 有 旦 具有 单位 长 度 ) 。 知 一 个 矩阵 的 行 回 量 都 


是 规范 正 交 的 ， 则 称 此 和 矩阵 为 正 交 污 阵 (orthogonal matrix〉。 正 交 和 矩 
阵 有 个 引 人 注 目的 性 质 ， 即 它 的 逆 和 矩阵 与 转 置 算 阵 是 相等 的 : 
+(l—c)r (1—e) TV 一 sz (1 —c)rz+ sy 


R-'=R! 一 (1 C)TY 十 52 二 位 二 DY (1 —c) )y2 一 37 
(1 —c)rz— sy ee 十 ST c+ (1 一 c)z2 





通常 来 说 ， 由 于 正 交 拖 阵 的 逆 矩 阵 计算 方便 且 高 效 ， 所 以 很 受 至 
睐 。 
特别 地 ， 如 果 选 择 绕 z 轴 、?Y 轴 或 > 轴 进 行 旋转 〈 即 分 别 取 寻 = (1,0,0) 


、7 二 (0,1,0) 和 mn = (0,0,1)) ， 便 会 获得 以 z、y、: 为 旋转 轴 的 对 应 旋转 
矩阵 : 


] 0 0 0 cos@ 0 一 SmnO 0 cosO sinG 0 0 
R_ _- 0 cos@ sing 0 0 1 0 0 R _- —sin@ cos@ 0 0 
7 |0 -sng cosg 0|° YY |sing 0 cos@ 0 ~ 0 0 1 0 
0 0 U 1 0 0 0 1 0 0 0 1 

例 3. 3 


假设 定义 了 一 个 最 小 点 坐标 为 (-1 0, =-D 和 最 大 点 坐标 为 (1 0, 1) 的 
正方 形 。 现 在 ， ai oho ( 即 按 逆 时 针 方 向 
旋转 30") 。 根 据 问题 所 述 可 知 ，n = (0, 1 0)， 代 入 Rn 并 进行 化 简 ， 可 
得 到 y 才 的 旋转 矩阵 为 : 


cos0 0 —sing cos(—30°) 0 一 sin( 一 30?) 党 0 
0 1 0 0 1 0 一 |0 1 


sin@ 0 cos sin(—30°) 0 cos(—30°") 上 0 


~ OLI~— 





为 了 旋转 该 正方 形 ， 还 需 将 其 最 小 点 、 最 大 点 坐标 分 别 乘 以 得 到 的 
旋转 矩阵 : 


va” nn V3 n 1 
3 0 3 7 0 3 
[-1,0,—1]|10 1 0|>=[-0.36,0, -1.36] [1,0,1]|0 1 0|>= 
Vv Vv 


[0.36, 0,，1.36] 


"|S 


结果 如 图 3.4 所 示 。 


+2 旋转 +Z 





(0.36, 0, 1.36) 
(1,0, 1) 








(i0=D 
(一 0.36, 0, —1.36) 








了 了 




















图 3.4 令 例 3.3 中 的 正方 形 绕 y 轴 旋转 一 30" 后 的 效果 。 注 意 ， 当 沿 着 Y 铀 正方 向 俯 隔 的 时 候 ， 由 
于 VY 三 0， 因 此 示意 图 看 上 去 是 2D 效 果 

















3.2 ” 仿 射 变换 


3.2.1 齐 次 坐标 


在 下 一 节 中 我 们 将 会 看 到 ， 仿 射 变 换 (affine transformation) 是 由 
一 个 线性 变换 与 一 个 平移 变换 组 合 而 成 的 。 对 于 问 量 而 言 ， 平 移 操 作 是 
没有 音义 的 ， 因 为 向 量 只 揪 述 方向 与 大 小 、 却 与 位 置 无 天 。 换 人 句 话 说 ， 
平移 操作 不 应 作用 于 向 量 。 因 此 ， 和 平移 变 换 只 能 应 用 于 点 《即位 置 癌 
量 ) 。 章 次 坐标 (homogeneous coordinate) 所 提供 的 表示 机 制 ， 使 我 们 
可 以 方便 地 对 点 和 回 量 进行 统一 的 处 理 。 在 采用 齐 次 坐标 表示 法 时 ， 我 
们 将 坐标 扩充 为 四 元 组 ， 其 中 ， 第 四 个 坐标 w 的 取 值 将 根据 被 描述 对 象 
是 点 还 是 癌 量 而 定 。 有 具体 来 讲 : 

















在 后 面 我 们 将 会 证 明 : 设 w = 1] 能 使 点 被 正确 地 平移 ， 设 w = 0 则 可 
以 防止 向 量 坐 标 受到 平移 操作 的 影响 (我 们 不 希望 对 向 量 的 坐标 进行 平 
移 变换 ， 因 为 这 个 计算 过 程 会 改变 它 的 方向 和 大 小 一 一 而 平移 操作 不 应 
当 修 改 向 量 的 任何 一 种 “属性 ”)。 














注意 Note Wp 


齐 次 坐标 表示 法 与 图 1.17 所 示 的 思路 一 致 ， 即 两 点 之 差 
q — P= (qr,qy,4:;1) — (pr; py;P:,1) = (qz — Pr; Gy — Py;4: Pp:,0) 得 到 的 是 一 
个 同 量 ， 而 一 个 点 与 一 个 向 量 之 和 
P+ v= (pz,Py,pP:,1) + (Vz, vy, Vs,0) = (pz + Vz, Py + Vy Pp: + vV:, 1) 得 到 的 是 一 
明证 二 可 


3.2.2 ” 仿 射 变换 的 定义 及 其 窍 阵 表示 


线性 变换 并 不 能 表示 出 我 们 需要 的 所 有 变换 ， 因 此 ， 现 将 其 扩充 为 
一 种 称 作 仿 射 变换 的 映射 范围 更 广 的 函数 类 。 仿 射 变换 为 一 个 线性 变换 
加 上 一 个 平移 同 量 w， 即 


alu) = 7T(u)+b 


或 者 用 矩阵 表示 法 
Al! .412 A13 

alu)=uA+b=|lr, yy, 2] iA A A | + [br, b,, b.| = ER V. | 
A3l A32 A33 


其 中 ，A 是 一 个 线性 变换 的 矩阵 表示 。 


如 果 用 w = 1 把 坐标 扩充 为 齐 次 坐标 ， 那 么 就 可 以 将 上 式 更 简洁 地 
写作 : 


bs b, b. ] (3.6) 


式 《3.6) 中 的 4 x 4 矩阵 称 为 仿 射 变换 的 窍 阵 表示 。 





可 以 看 出 ， 加 上 癌 量 "的 这 步 运算 ， 从 本 质 上 来 说 是 一 种 平移 操作 
《使 目标 对 象 的 位 置 发 生 了 改变 ) 。 但 是 ， 我 们 既 不 希望 将 此 平移 操作 
应 用 到 向 量 上 因为 向 量 的 性 质 中 并 没有 位 置 这 个 概念 ) ， 又 想 令 同 量 
受到 念 射 变换 中 线性 部 分 的 处 理 。 此 时 ， 如 果 将 问 量 的 第 四 个 分 量 设 为 
w 二 0， 它 便 不 会 受到 疝 量 b 平 移 操作 的 影响 (可 通过 和 窍 阵 的 乘法 运算 来 
验证 这 一 点 ) 。 


注 意 Note ee 


由 于 行 向 量 与 上 述 4 x 4 仿 射 变换 矩阵 的 第 四 列 点 积 
ey 可 0,0,0, 了 = w， 所 以 此 矩阵 不 会 改变 输入 向 量 的 w 坐 标 。 


3.2.3 “平移 


恒 等 变 换 (identity transformation) 是 一 种 直接 返回 其 输入 参数 的 
线性 变换 ， 形 如 ITlw) = ww。 不 难 证 明 ， 这 种 线性 变换 的 矩阵 表示 即 为 单 


位 矩阵 。 
现 将 平移 变换 (translation transformation ) 定义 为 仿 射 变换 ， 此 
时 ， 其 中 的 线性 变换 就 是 一 种 恒 等 变 换 ， 即 
T(u)=uIl+b=utib 
如 您 所 见 ， 此 线性 变换 简单 地 利用 问 量 b 对 点 ww 进 行 平移 (或 位 
移 ) 。 图 3.5 详 细 地 展示 了 物体 位 移 的 过 程 一 一 物体 上 的 每 个 点 都 通过 
同一 辣 量 b 进 行 了 平移 。 





图 3.5 ”借助 位 移 向 量 b 对 蚂蚁 进行 位 移 
根据 式 〈3.6) 可 知 ，r 的 矩阵 表示 为 : 


1] 0 0 0 
0 1 0 0 
0 0 1 0 
pr b, b. 1 


T= 


该 窍 阵 称 为 平移 窍 阵 (translation matrix) 。 


平移 窍 阵 的 逆 矩 阵 则 为 : 





例 3. 4 

假设 定义 了 一 个 正方 形 ， 其 最 小 点 坐标 为 (-8, 2, 0)， 最 大 点 坐标 为 
(-2, 8, 0)。 我 们 希望 将 此 正方 形 沿 z 轴 正方 向 平移 12 个 单位 ， 沿 y 轴 正方 
加 平移 -10 个 单位 ， 在 : 轴 方 回 保 持 不 变 ， 则 其 对 应 的 平移 矩阵 为 : 


] U 0 0 

0 1 0 0 
区 md 

U U 0 

1]2 一 10 0 1 


现 对 此 正方 形 进行 平移 “变换 ) ， 将 其 最 小 点 、 最 大 点 坐标 分 别 乘 
以 上 述 平 移 矩 阵 : 





] 0 0 0 
_ _ 0 1 0 0 0 
— 8, 2. 0,] = [4， 一 8，0, 
| 1 0 0 1 0 [4 | 1 
12 一 10 0 1 
1 0 0 0 
ee 0 1 0 0 _ 
一 2.8 0. ] 一 |10， 一 2，0. 
1 0 0 1 1 1 
12 一 10 0 1 
平移 结果 如 图 3.6 所 示 。 
+Y 平移 + 
(—2,8,0) 
(-8,2,0) +X +X 
彼 (10, 22, 0) 














(4,—8,0) 
了 


图 3.6 ”将 例 3.4 中 的 正方 形 在 I 轴 上 平移 12 个 单位 长 度 ， 在 Y 轴 上 平移 -10 个 单位 长 度 。 
注意 ， 在 向 z 轴 负 方 向 俯 辐 的 时 候 ， 由 于 z= 0， 因 此 几何 图 示 呈 2D 效 果 





注 意 Note 


设 了 为 一 个 变换 和 矩阵， 我 们 可 通过 计算 乘积 vT = wv' 来 变换 一 个 点 或 
各 量 。 不 难看 出 ， 若 通过 T 对 点 或 向 量 进 行 变换 之 后 ， 再 经 其 逆 和 矩阵 
T-! 的 变换 ， 那 么 ， 最 终 会 得 到 初始 的 同 量 : vTTT! = vI = vw。 换 人 句 话 
说 ， 逆 变换 能 够 “还 原 ” 变 换 操 作 。 例 如 ， 如 果 将 一 个 点 在 z 轴 正方 向 平 
移 5 个 单位 ， 再 通过 逆 变 换 ， 令 该 点 沿 z 轴 正方 向 平移 -5 个 单位 ， 那 么 ， 
此 点 最 终 会 回 到 初始 的 位 置 。 又 如 ， 若 令 一 个 点 绕 y 轴 旋转 30*， 再 根据 
逆 变 换 使 该 点 绕 y 轴 旋转 -30"， 则 此 点 最 终 也 将 回 到 起 始 位 置 。 总 的 来 
说 ， 变 换 矩 阵 及 其 逆 矩 阵 的 作用 正 相 反 。 这 两 种 变换 的 复合 ， 从 几何 学 
的 角度 上 来 看 使 物体 保持 不 变 。 





3.2.4 缩放 和 旋转 的 仿 射 窍 阵 


通过 观察 可 以 发 现 ， 如 果 b = 0， 则 仿 射 变换 将 退化 为 线性 变换 。 这 
样 一 来 ， 我 们 束 能 用 b = 0 的 仿 射 变换 来 表示 任意 线性 变换 。 更 进一步 
说 ， 也 就 意味 着 仅 通过 一 个 4 x 4 的 仿 射 矩阵 表达 出 任意 的 线性 变换 。 例 
如 ， 缩 放 抢 阵 与 旋转 矩阵 可 写作 下 列 的 4 x 4 矩阵 : 








st 0 0 0 
0 s, 0 0 
0 0 s. 0 
0 0 0 1 


c 十 (一 c)r? ( 工 一 cjzy 十 sz (1 一 cirz 一 sSV 0 
(1—c)ry—sz c+(l—c)y (1 -cyz+sr 0 
PR | \ ; \ V2 
{1l—ec)jrzz+i+sy (ll—cwyz—sr c+{(l—ce)z 0 
0 0 0 1 


如 此 一 来 ， 就 能 用 4 x 4 矩阵 统一 地 表示 所 有 变换 ， 并 通过 1 x 4 齐 次 
行 回 量 来 表示 点 和 问 量 。 





3.2.5” 仿 射 变 换 窍 阵 的 几何 意义 


经 过 本 节 的 学 习 ， 我 们 对 仿 射 变换 矩阵 中 各 项 数据 几何 意义 上 的 直 
觉 将 得 到 进一步 的 提升 。 首 先 让 我 们 来 考察 刚体 变换 《rigid body 
transformation) ， 其 本 质 是 一 种 保 形 (shape preserving， 即 保持 形状 ) 
变换 。 以 下 便 是 刚体 变换 在 现实 生活 中 的 一 个 例子 : 从 书 保 上 拿 起 书 ， 
再 将 它 放 到 书架 上 。 在 移动 书 的 这 个 过 程 中 《平移 ) ， 很 可 能 会 改变 它 
的 袁 回 (旋转 ) 。 设 7 为 描述 物体 旋转 操作 的 旋转 变换 ， 而 b 为 定义 物体 
平移 操作 的 平移 同 量 。 那 么 ， 刚 体 变换 就 可 以 用 仿 射 变换 来 表示 : 

atT, Yy, 2) = 7T(T, UV 2 十 已 一 TTi 十 VTL7) 十 zT( 有) 十 也 
在 矩阵 表示 法 中 ， 知 采用 齐 次 坐标 〈 表 示 点 时 ，w = 1; 表示 问 量 


时 ，w = 0， 如 此 一 来 ， 平 移 变换 就 不 会 作用 于 向 量 ) ， 上 式 将 被 改写 
为: 


gw 


至 此 ， 为 了 理解 此 方程 的 几何 意义 ， 我 们 还 要 将 窍 阵 中 的 行 向 量 依 
次 绘制 出 来 〈 见 图 3.7) 。 由 于 7 是 一 个 旋转 变换 ， 所 以 它 具 有 保 长 性 与 
保 角 性 〈 详 见 章 末 习 题 26) 。 特 别 是 我 们 能 看 到 7 仪 将 标准 基 向 量 i、3 
和 k， 分 别 旋转 到 对 应 的 新 方向 (9 、7T(7) 和 7(R)。 而 向 量 b 则 是 一 个 位 置 
向 量 ， 它 表示 物体 相对 于 原点 的 位 移 。 现 在 来 看 图 3.7， 它 以 几何 学 的 
角度 展示 了 如 何 通 过 计算 atz,y 2)=zrtz 十 yT(7) 十 z7(k) 十 b 来 求 取 变 
换 后 的 点 。 


























这 种 思路 同样 可 以 运用 在 缩放 或 斜 切 〈skew， 也 有 译作 倾 笠 、 扭 曲 
等 ) 变换 上 。 请 考虑 这 样 一 种 线性 变换 -， 它 将 图 3.8 所 示 的 正方 形 拉 扯 
为 一 个 平行 四 边 形 。 和 伴 切 处 理 后 的 点 即 为 斜 切 变换 后 的 基 回 量 的 线性 组 





图 3.7” 仿 射 变换 矩阵 中 行 向 量 的 几何 意义 。 点 CQ 了) 是 变换 后 的 基 向 量 r(2、7(7)、7T(RJ 与 入 
移 向 量 b 的 线性 组 合 

















图 3.8 ”对 于 一 种 把 正方 形 拉扯 为 平行 四 边 形 的 线性 变换 而 言 ， 经 过 变换 的 点 T(P) = (Z: 切 即 
为 斜 切 变换 后 的 基 向 量 "(2) 与 "(7) 的 线性 组 合 


3.3 ”变换 的 复合 办 


假设 Ss 是 一 个 缩放 矩阵，R 是 一 个 旋转 矩阵 ， 工 是 一 个 平移 窍 阵 。 
现 给 定 一 个 由 8 个 顶点 w (其 中 = 0,1,… ,1) 构成 的 立方 体 ， 并 希望 将 
这 3 种 变换 相继 应 用 到 此 正方 体 的 每 个 顶点 之 上 。 我 们 以 下 列 简明 的 方 
式 来 逐步 对 顶点 进行 变换 : 


((viS)R)T = (v.R)T=vT=wvi 其 中 i=0,1,…,7 
然而 ， 由 于 矩阵 乘法 满足 结合 律 ， 因 而 此 式 可 以 等 价 地 改写 为 : 
vi(SRT) = wv 其 中 i=0,1,… ,7 


还 可 将 C = SRT 视 为 一 个 矩阵 ， 即 提前 将 3 种 变换 封装 为 一 个 疤 变 
换 和 矩阵 。 换 句 话 说 ， 和 矩阵 之 间 的 乘法 法 则 使 我 们 得 以 将 不 同 的 变换 连接 
在 一 起 。 





这 里 实际 还 涉及 性 能 问题 。 来 看 一 个 例子 : 假设 有 一 个 由 20000 个 
点 组 成 的 3D 物 体 ， 我 们 希望 将 上 述 3 种 几何 变换 ， 逐 个 作用 到 这 个 物体 
上 。 如 果 采 用 按部就班 的 计算 方法 ， 我 们 需要 进行 20000 x 3 次 向 量 与 矩 
阵 的 乘法 运算 。 但 通过 上 述 组 合 窍 阵 的 计算 方法 ， 只 需要 执行 20000 次 
的 同 量 与 第 阵 乘 法 运算 以 及 两 次 矩阵 与 矩阵 的 乘法 运算 即 可 。 显 而 易 见 
的 是 ， 比 起 前 者 中 近 3 倍 的 大 量 向 量 与 盾 阵 乘法 运算 而 言 ， 后 者 中 两 次 
额外 的 矩阵 与 矩阵 乘法 运算 真 可 谓 是 九 牛 一 毛 。 




















注 车 Note 


这 里 要 再 次 指出 : 矩阵 之 间 的 乘法 运算 不 满足 交换 律 。 这 一 点 亦 可 
以 从 几何 角度 上 看 出 。 例 如 ， 一 个 旋转 操作 后 面 跟 有 一 个 平移 变换 ， 我 
们 能 够 用 和 矩阵 的 乘积 RT 来 表示 。 而 采用 同样 的 变换 矩阵 ， 先 平移 后 旋 
转 ， 即 TR， 它 的 变换 结果 却 与 RT 全 然 不 同 。 图 3.9 演 示 了 这 两 种 变换 
过 程 的 差异 。 











¥ 





(a) (b) 


图 3.9 两 种 变换 过 程 的 差异 比较 
(a) 先 旋转 后 平移 ”(b》〉 先 平移 后 旋转 


3.4 坐标 变换 加 | 


众所周知 ，100C 表 示 的 是 摄氏 温标 下 水 的 沸点 。 那 么 ， 怎 样 用 华 
氏 温标 来 描述 这 同样 环境 下 水 的 沸 氮 呢 ? 换言之 ， 奉 用 华氏 温标 表示 水 
的 沸点 ， 其 对 应 的 标量 值 是 多 少 呢 ? 为 了 实现 此 转换 《或 称 标 架 的 变 
换 ) ， 我 们 需要 知道 Ee 








tt A 由 此 可 知 ， 水 的 沸点 换算 为 华氏 度 为 


通过 这 个 例子 可 知 : 根据 标 架 4 与 男 一 不 同 标 架 B 的 关系 ， 我 们 就 
可 以 将 相对 于 标 架 4 表示 某 量 的 标量 :， 转 换 为 相对 于 标 架 B 描 述 同 一 种 
量 的 新 标量 以 。 在 后 续 子 小 节 中 ， 我 们 会 遇 到 类 似 的 问题 ， 但 届时 我 们 
研究 的 并 不 再 是 标量 ， 而 是 要 相对 于 不 同 的 标 架 来 转换 点 或 向 量 的 坐标 
《 见 图 3.10〉。 我 们 把 不 同 标 染 间 的 坐标 的 转换 称 之 为 坐标 释 换 


(change of coordinate transformation) 。 

















v= (x,y) 


并 /大 


标 架 4 





标 架 B 














图 3.10 ”同一 个 向 量 v 在 不 同 的 标 架 中 有 着 不 同 的 坐标 。 此 向 量 在 标 架 4 中 的 坐标 为 (Z, 急 ， 
在 标 架 巨 中 的 坐标 则 为 (7 








值得 注意 的 是 ， 在 坐标 变换 的 过 程 中 ， 几 何 体 本 映 并 没有 随 之 发 生 
改变 。 坐 标 变换 改变 的 仅 是 物体 的 参考 系 〈 又 称 参 照 系 ) ， 因 此 改变 的 
实 为 几何体 的 坐标 表示 。 相 比 之 下 ， 我 们 可 以 认为 旋转 、 平 移 和 缩放 这 
些 操作 才 使 几何 体 发 生 了 实质 上 的 移动 或 形变 。 





在 3D 计 算 机 图 形 学 中 ， 我 们 往往 会 用 到 许多 不 同 的 坐标 系 ， 所 以 
需要 了 解 在 它们 之 间 互 相 转 换 坐 标的 方法 。 由 于 位 置 是 点 的 属性 ， 与 问 
量 无 天 ， 所 以 反 和 同 量 的 坐标 变换 是 不 同 的 ， 下 面 就 此 展开 开 讨 论 。 


3.4.1 问 量 的 坐标 变换 


思考 图 3.11， 其 中 有 一 癌 量 Pp 分别 位 于 标 桨 4 和 标 架 B 之 中 。 假 设 给 
定向 量 p 在 标 架 4 中 的 坐标 为 Pa = (7;YW， 现 希望 求 得 向 量 P 在 标 架 3 中 的 
对 应 坐标 PB = (7,Y)。 换 言 之 ， 如 果 给 出 了 一 个 向 量 在 菜 一 个 标 架 中 的 
坐标 ， 那 么 如 何 求 出 该 向 量 在 男 一 个 不 同 标 架 中 的 对 应 坐标 呢 ? 








SI Pa= (xX,y) 


: 3 
了 


标 架 4 2 





标 架 B 








图 3.11 求 取 向 量 P 在 标 架 BB 中 坐标 的 几何 示意 图 





从 图 3.11 中 可 知 : 


P= IuU+Yyv 


其 中 ，w 和 vw 分别 是 标 架 中 z 轴 、y 轴 正方 同上 的 单位 同 量 。 用 标 染 B 
中 的 坐标 来 表示 以 上 公式 中 的 单位 向量 ， 可 得 : 





pp 一 TUB 十 VD 
所 以 ， 如 果 给 定 P4 = \ 切 ， 也 已 知 向 量 x 和 向 量 w 相 对 于 标 架 刀 的 坐 
标 分 别 为 8 = (wwWy) 以 及 ?8 = (orty)， 那 么 就 一 定 能 求 出 pp = (TY)。 
现 将 向 量 的 坐标 变换 推广 到 3D 空 间 ， 如 果 Pa = (7,y,?)， 那 么 
Dp = TUB TT YUVB TT Wp 


其 中 ，w、w 和 w 分 别 是 指 问 标 架 中 z 轴 、y 轴 和 s 轴 正方 同上 的 单位 
器 


i 


3.4.2 点 的 坐标 变换 


点 与 癌 量 的 坐标 变换 稍 有 不 同 ， 这 是 由 于 位 置 是 点 的 一 个 重要 属 
性 ， 因 而 不 能 将 图 3.11 所 示 的 同 量 平 移 方法 应 用 于 点 上 。 





图 3.12 展 示 了 一 个 对 点 进行 坐标 变换 的 情景 ， 通 过 观察 ， 可 以 将 点 
P 表 示 为 : 
P=7Iu+YyV+Q 
其 中 和 w 是 分 别 指向 标 架 4 中 z 轴 和 vy 轴 正 方向 上 的 单位 向 量 ， 且 Q@ 
是 标 染 4 中 的 原点 。 用 标 架 8B 中 的 坐标 来 表示 上 式 中 的 每 一 个 同 量 和 
点 ， 可 得 : 


pp = TUuB+YVB+ QBp 


如 果 给 出 Pa = (2 急 ， 同 时 也 知道 向 量 w、zvw 以 及 原点 人 相对 于 标 架 
的 坐标 分 别 为 8 = (vz;Wy)、V8 = (or ty 以 及 Se = (8z;Qy)， 那 么 ， 我 们 
总 能 求 出 Pp = (TV ) 





> +X 








| 标 架 B 
图 3.12 求 取 点 P 在 标 架 电 中 坐标 的 几何 示意 图 
现 把 点 的 坐标 变换 推广 到 3D 空 间 ， 如 果 P4 = (7,y,?)， 那 么 
Pp = TUB 十 YVB 十 21DB 十 QQp 


其 中 ， 同 量 w、wv 和 w 是 分 别 指 同 标 架 4 中 z 轴 、y 轴 和 s 轴 的 正方 同上 
的 单位 向 量 ，Q@ 则 为 标 架 4 中 的 原点 。 





3.4.3 ”坐标 变换 的 矩阵 表示 


到 目前 为 止 ， 我们 已 经 分 别 探讨 了 向 量 和 点 的 坐标 变换 : 





(Zi ,2) = TUB+YVB+ WB 对 于 向 量 而 言 
(ZY,2) = TuB+YVB+ WB+ Op 对 于 点 而 言 


如 果 使 用 齐 次 坐标 ， 融 可 以 用 同一 公式 对 点 和 回 量 进行 处 理 : 


(ZU = TUB+YVB+ WB+ QBp (3.8) 


如 果 w = 0， 此 式 化 简 为 向 量 的 坐标 变换 公式 ; 如 果 w = 1， 则 此 式 
化 简 为 点 的 坐标 变换 公式 。 式 〈3.8) 的 优点 在 于 : 只 要 为 其 正确 地 设 
置 w 分 量 值 ， 它 就 能 相应 地 处 理 点 或 回 量 的 坐标 变换 。 这 样 一 来 ， 我 们 
也 就 无 须 分别 记 住 两 个 公式 了 一 个 处 理 向 量 ， 男 一 个 处 理 点 ) 。 根 据 
式 (2.3) ， 可 以 将 式 〈3.8) 改写 为 矩阵 形式 : 


UB 一 


区, YZ, WwW) = [7, Y, 2, 也 ] -9 
| WB 


有 Qp 一 
Ur Uy, 2 0 
Ur Vy vw: 0 
Wr Wy Ww 0 
Wr Wy WV: 1 


= TUB 十 VDB + WwWB + wp (3.9) 

其 中 ， Qs= (0 0, 1)}ws = (tz, Uy, uU.,0)vB = (vz, Uy, u-; 0) 与 
WwB 二 (wz, Wy, WwW:,0) 分 别 表示 标 架 4 中 的 原点 和 诸 坐 标 轴 相 对 于 标 架 B 的 
齐 次 坐标 。 我 们 把 式 〈3.9) 里 能 把 标 架 4 中 的 坐标 转换 《或 映射 ， 


map) 为 标 架 巨 中 华 标 的 4 x 4 算 阵 ， 称 为 坐标 变换 阜 阵 〈change of 
coordinate matrix) 或 标 架 变换 所 阵 〈change of frame matrix) 。 


3.4.4 坐标 变换 矩阵 及 其 结合 律 


现 假 设 有 3 个 标 染 F、G 和 五 。A 为 将 坐标 从 F 转 换 到 G 的 标 染 变换 算 
阵 ，B 为 把 坐标 由 G 转 换 至 的 标 染 变换 和 矩阵。 在 标 架 F 中 ， 有 一 问 量 的 





坐标 为 Pr， 我 们 希望 求 出 此 向 量 相对 于 标 架 瑟 的 坐标 zjr。 可 按 一 和 顺序 
来 逐步 计算 : 

(prA)B= py 

(Pa)B = pp 


由 于 和 矩 阵 的 乘法 运算 满足 结合 律 ， 我 们 可 将 (PF 4)B = Pn 写作 : 


pr(AB) = Pp 





这 样 一 来 ， 就 能 把 矩阵 乘积 C = AB 看 作 是 将 坐标 从 标 架 F 直 接 变 
换 至 标 染 五 的 标 染 变换 答 阵 ， 它 将 变换 矩阵 A 和 BB 结合 为 一 个 净 和 矩阵 
一 一 其 思路 就 类 似 于 函数 的 复合 。 





这 种 计算 方法 还 会 对 性 能 产生 影响 。 为 了 说 明 这 一 点 ， 我 们 假设 一 
个 由 20000 个 点 构成 的 3D 物 体 ， 现 要 对 它 的 每 个 点 进行 两 次 标 架 变 换 。 
右 使 用 逐步 计算 的 方法 ， 我 们 需 进 行 20000 x 2 次 回 量 与 矩阵 的 乘法 运 
算 。 但 利用 结合 矩阵 的 方法 ， 我 们 只 要 进行 20000 次 癌 量 与 算 阵 的 乘法 
运算 以 及 一 次 矩阵 与 矩阵 的 乘法 运算 (用 于 结合 两 个 标 染 变换 矩阵 ) 即 
可 。 不 难看 出 ， 仅 借助 一 次 开销 极 低 的 矩阵 之 间 的 乘法 运算 ， 便 可 以 节 
省 多 次 癌 量 与 窍 阵 乘法 所 需 的 大 量 计算 资源 。 








注意 Note We 


重要 的 事情 说 3 裔 和 矩阵 乘法 是 不 满足 交换 律 的 ， 所 以 请 不 要 认为 
矩阵 乘积 4B 与 矩阵 乘积 BA 表示 的 是 相同 的 复合 变换 。 具 体 来 说 ， 和 矩 





阵 相 乘 的 顺序 就 是 变换 的 顺序 。 一 般 而 言 ， 它 们 的 处 理 顺 序 是 不 能 随意 
调换 的 。 


3.4.5 ”坐标 变换 窍 阵 及 其 逆 窜 阵 





假设 给 定向 量 P 相 对 于 标 架 B 的 坐标 PB8， 以 及 将 坐标 由 标 染 4 转换 到 
标 架 B 的 变换 矩阵 MM， 即 有 PB = P424 。 现 希望 求 得 P4。 换 句 话说 ， 我 
们 这 次 是 希望 通过 坐标 变换 官 阵 ， 将 标 架 巨 中 的 坐标 映射 到 标 惧 4 中 。 
为 了 求 出 这 个 矩阵 ， 我 们 假设 矩阵 MM 是 可 逆 的 〈 即 存在 M1) 。 通 过 下 
列 步 又， 我 们 惑 能 得 到 坐标 P4: 


pp = PAM 
PgsM ”=PAMM 等 式 左右 两 侧 同时 乘 以 矩阵 M-: 
pBRM =pal 由 首 矩 阵 的 定义 可 知 MAM- = 了 
PBRMT = Pa 由 单位 矩阵 的 定义 可 知 Ps 工 = Pa 


所 以 矩阵 AM 一 即 为 将 坐标 由 标 架 互 转换 到 标 杂 4 的 变换 窍 阵 。 





图 3.13 说 明了 坐标 变换 矩阵 及 其 逆 矩 阵 之 间 的 关系 。 还 有 一 氮 要 注 
意 的 是 ， 本 书 内 所 有 的 标 架 变换 映射 都 是 可 逆 的 ， 因 此 我 们 不 必 担 心 逆 
矩阵 是 人 否 存 在 这 一 问题 。 


标 架 BB 


A 


图 3.13 ”矩阵 MI 把 标 架 44 中 的 坐标 映射 到 标 架 轧 ， 和 矩阵 MI 下 则 把 标 架 BB 中 的 坐标 映射 到 标 架 44 


标 架 4 








图 3.14 展 示 了 如 何 用 坐标 变换 矩阵 来 解释 逆 窍 阵 的 性 质 ( 


AB)!'!=B A! 


标 架 下 万 = 人 标 加 五 


图 3.14 ”和 矩阵 入 把 坐标 从 标 架 五 映射 到 标 架 G， 和 矩阵 吾 把 坐标 从 标 架 G 映 射 到 标 架 卫 ， 和 矩阵 乘 
积 

AB 则 把 坐标 从 标 架 五 直接 映射 至 标 架 瑟 。 和 矩阵 召 ”! 把 坐标 从 标 架 瑟 映射 到 标 架 G， 和 矩阵 A ! 

把 坐标 从 标 架 G 映 射 到 标 架 瑟 ， 利 用 和 矩阵 乘积 BB“!A”! 则 可 把 坐标 直接 从 标 架 瑟 映 射 至 标 架 下 














3.5 ”变换 矩阵 与 坐标 变换 窍 阵 


到 目前 为 止 ， 我们 已 经 对 “使 几何 体 本 里 发 生 改 变 ” 的 变换 (缩放 、 
旋转 和 平移 ) 与 坐标 变换 进行 了 区 分 。 在 本 节 中 ， 我 们 将 证 明 : 从 数学 
角度 上 看 ， 两 者 在 数学 上 其 实 是 等 价 的 。 即 ， 可 将 改变 几何 体 的 变换 解 
释 为 坐标 变换 ， 反 之 亦 然 。 





图 3.15 展 示 了 式 (3.7) 中 的 行 同 量 ( 令 物体 先 旋 转 再 平移 的 念 射 变 
换 和 矩阵 ) 与 式 〈3.9) 中 的 行 风量 《坐标 变换 矩阵 ) 在 几何 意义 上 的 相 
似 性 。 





图 3.15 ”从 图 中 可 以 对 比 看 出 8 二 @，7) 三 TU) 二 2，T(kR) 二 Ww。 图 中， 假设 我 们 
在 当前 的 工作 中 所 采用 的 坐标 系 为 标 架 互 ， 现 在 要 运用 仿 射 变换 相对 于 标 架 如来 改变 图 内 立方 
体 的 位 置 以 及 朝向 ， Q(T, yz) = TT(z) 十 YT(7) 十 2zT(kR) 十 bb。 图 b 中 ， 我 们 有 标 架 
4 与 标 架 BB 两 个 坐标 系 。 通 过 公式 PB 一 TUB 十 YVB 十 2WB 十 WWQ@B 就 可 以 把 相对 于 标 架 44 
组 成 立方 体 的 诸 点 坐标 转换 为 标 架 已 中 的 坐标 ， 其 中 PP4 二 TZ,Y, >, WW)。 在 这 两 种 情形 之 中 ， 


/ 


我 们 可 以 分 别 得 到 相对 于 标 架 BB 中 的 坐标 9(P) = (TV, 2,w) = Pp 


























如 果 我 们 能 认识 到 这 一 点 ， 会 发 现 其 意义 非凡 。 对 于 坐标 变换 来 
说 ， 标 架 之 间 的 差异 仅 为 位 置 和 朝 同 。 因 此 ， 令 坐标 在 标 染 之 间 转 换 的 
数学 公式 实质 上 摘 述 的 即 为 所 需 执 行 的 旋转 和 平移 操作 ， 最 终 也 会 得 到 


与 几何 变换 《对 物体 进行 缩放 、 旋 转 和 平移 ) 相同 的 数学 形式 ， 可 谓 殊 
途 同 昭 。 几 何 变换 也 好 ， 坐 标 变换 也 喷 ， 计 算出 的 结 采 都 是 相同 的 ， 关 
别 只 在 于 解释 变换 的 角度 。 对 于 某 些 情况 来 说 ， 保 持 物体 不 变 ， 使 之 在 
多 个 坐标 系 之 间 转 换 是 种 更 直观 的 办 法 。 但 是 ， 知 描述 对 象 的 参考 系 发 
生 了 变化 ， 则 物体 的 坐标 表示 也 会 随 之 改变 〈 图 3.15b 演 示 了 这 种 情 

景 ) 。 有 些 时 候 ， 我 们 又 希望 在 同一 个 坐标 系 中 表示 物体 的 变换 ， 而 不 
改变 其 参考 系 〈 这 种 情况 可 参见 图 3.15a) ， 此 时 即 可 采用 几何 变换 法 。 





这 段 讨 论证 实 了 我 们 能 够 将 一 个 改变 几何 体 的 复合 变换 《缩放 、 旋 
转 和 平移 )， 解 释 为 一 种 对 应 的 坐标 变换 。 由 于 我 们 以 后 通常 要 将 世界 
空间 (第 5 章 )〉 的 坐标 变换 矩阵 定义 为 绒 放 、 旋 转 和 平移 操作 组 成 的 复 
合 变 换 ， 所 以 了 解 这 一 点 是 很 重要 的 。 





3.6 DirectXMath 库 提供 的 变换 函数 


本 节 我 们 对 DirectXMath 库 中 与 变换 相关 的 函数 进行 总 结 ， 以 供 参 
考 。 








// 构建 一 个 缩放 和 矩阵 : 
XMMATRIX XM CALLCONV XMMatrixScaling( 

float ScaleX， 

float ScaleY， 

float ScaleZ) ; // 缩放 系数 











// 用 一 个 3D 向 量 中 的 分 量 来 构建 缩放 和 矩阵: 
XMMATRIX XM CALLCONV XMMatrixScalingFromVector( 
FXMVECTOR Scale); // 缩放 系数 (sx,sy，sz) 

















// 构建 一 个 绕 x 轴 旋转 的 矩阵 Ry: 
XMMATRIX XM CALLCONV XMMatrixRotationX( 
float Angle); // 以 顺 时 针 方 向 按 弧 度 9 进 行 旋转 


// 构建 一 个 绕 y 轴 旋转 的 矩阵 Ry: 
XMMATRIX XM CALLCONV XMMatrixRotationY( 
float Angle); // 以 顺 时 针 方 回 按 弧 度 9 进 行 旋转 


// 构建 一 个 绕 z 轴 旋转 的 矩阵 R,: 
XMMATRIX XM CALLCONV XMMatrixRotationZz( 
float Angle); // 以 顺 时 针 方 辐 按 弧 度 9 进 行 旋转 


// 构建 一 个 绕 任 意 轴 旋转 的 矩阵 Rn: 
XMMATRIX XM CALLCONV XMMatrixRotationAxis( 







































































FXMVECTOR Axis, // 旋转 轴 n 
float Angle); // 沿 n 轴 正方 向 看 ， 以 顺 时 针 方 向 按 弧度 6 进 
行 旋转 





// 构建 一 个 平移 矩阵 : 
XMMATRIX XM CALLCONV XMMatrixTranslation( 

float OffsetX， 

float OffsetY， 

float OffsetZ) ; // 平移 系数 











// 用 一 个 3D 向 量 中 的 分 量 来 构建 平移 矩阵 : 
XMMATRIX XM CALLCONV XMMatrixTranslationFromVector( 





FXMVECTOR Offset ) ; // 平移 系数 (tx ty，tz) 














// 计算 向 量 与 矩阵 的 乘积 vyM， 此 函数 为 针对 点 的 变换 ， 即 总 是 默认 令 v，, = 1: 
XMVECTOR XM CALLCONV XMVector3TransformCoord( 

FXMVECTOR V， // 输入 癌 量 v 
CXMMATRIX M); // 输入 矩阵 M 






































// 计算 向 量 与 矩阵 的 乘积 vyM， 此 函数 为 针对 向 量 的 变换 ， 即 总 是 默认 令 v,, = 8: 
XMVECTOR XM CALLCONV XMVector3TransformNormal( 

FXMVECTOR V, // 输入 问 量 v 

CXMMATRIX M); // 输入 矩阵 M 





对 于 最 后 的 两 个 函数 来 说 ， 用 户 不 必 显 式 设 置 w 人 分量， 因为 在 执 
行 XMVector3TransformCoord 时 ， 默 认 v = 1， 而 当 执 





行 XMVector3TransformNormal 时 ， 默 认 vw = 0。 


37 小结 


1. 缩放、 平移 和 旋转 这 3 种 基础 操作 的 变换 窍 阵 分 别 为 : 


sr 0 0 0 1 0 0 0 
SG U s, 0 0 TT 0 1 0 0 


0 0 s. 0I- |0 0 1 0 


c+{(l—e)r? (1l—c)ry+sz (1l—c)rz—sy 0 
(1—c)ry—sz c+(l—c)y (1—c)yz+sr 0 
(1—c)rzt+sy (1l—cjyz—sr c+(l—c)z* 0 

U 0 U ] 


RR -= 





2. 我 们 通过 4 x 4 矩阵 来 表示 变换 ， 并 利用 1 x 4 齐 次 坐标 来 描述 点 
和 问 量 : 当 把 第 4 个 分 量 设置 为 w = 1 时 ， 表 示 扣 ; 设置 为 wu = 0 时 ， 则 表 
示 回 量 。 这 样 一 来 ， 平 移 操 作 将 只 应 用 于 点 ， 而 不 会 影响 癌 量 。 











3. 如 果 一 个 矩阵 内 所 有 的 行 回 量 都 是 单位 长 度 且 两 两 正 交 ， 则 此 
矩阵 为 正 交 矩阵。 正 交 矩阵 有 个 特殊 性 质 : 它 的 逆 矩 阵 与 转 置 窃 阵 相 
等 。 因 此 ， 这 使 它 的 逆 矩 阵 计算 起 来 方便 且 高 效 。 另 外 ， 所 有 的 旋转 托 
阵 皆 为 正 交 矩阵 。 





4. 由 于 和 窍 阵 的 乘法 运算 满足 结合 律 ， 因 此 我 们 就 能 够 将 徊 干 种 变 
换 矩 阵 合 而 为 一 。 此 和 窍 阵 给 予 物体 的 变换 效果 ， 与 合成 它 的 多 个 单一 矩 
阵 对 物体 按 次 序 进 行 变 换 的 净 效 果 相 同 。 








5. 设 8Qg、uBg、vB 和 wB 分 别 表 示 标 架 4 中 的 原点 、z 轴 、y 轴 和 : 轴 


相对 于 标 架 B 的 坐标 。 如 果 一 个 向 量 (或 点 ) P 相 对 于 标 染 4 的 坐标 为 
Pa 二 (7,y,*)， 那 么 ， 此 同一 向 量 (或 点 ) 相对 于 标 架 互 的 坐标 为 : 

















(a) Pp = (7,Y,2) 一 TUB + YVB+ ZWwWB 针对 向 量 (具有 大 小 
和 方 癌 两 种 属性 ) 而 言 


(b) Pg 二 (ZY,2) 二 QB+TuB+yvB+zwB ”针对 位 置 向量 
〈 即 点 ) 而 言 





这 些 坐 标 变换 还 可 以 写 为 由 齐 次 坐标 组 成 的 和 窍 阵 形 陈 。 


6. 假设 有 3 个 标 架 已 、G 和 瑟 。 已 知 将 坐标 由 下 转 换 到 G 的 标 架 变换 
卸 阵 为 4， 把 坐标 由 G 转 换 到 巨 的 标 架 变换 和 窍 阵 为 妞 。 根 据 和 窍 阵 与 矩阵 的 
乘法 运算 法 则 ， 可 以 将 窍 阵 乘积 C = 4B 看 作 把 坐标 由 直接 转换 到 五 的 
标 架 变换 算 阵 。 这 束 是 说 ， 利 用 和 窍 阵 之 间 的 乘法 运算 ， 能 够 将 矩阵 A 和 
矩阵 吾 的 变换 效果 组 合 为 一 个 净 和 矩阵， 并 可 记 作 PF442) = Pa。 


7. 如 果 和 矩阵 MI 可 以 将 坐标 从 标 染 4 映 冉 至 标 染 8B， 那 么 ， 和 矩阵 M7 
则 能 够 将 坐标 由 标 架 B 映 财 到 标 染 4。 


8. 我 们 可 以 将 “ 令 几 何 体 自 喘 发 生 改变 ”的 变换 解释 为 坐标 变换 ， 
反之 亦 然 。 在 一 些 情景 中 ， 令 物体 保持 不 变 ， 使 其 在 多 种 坐标 系 之 间 进 
行 转换 则 更 为 和 直观。 但是， 大 描述 物体 的 相关 参考 系 产 生 了 变化 ， 物 体 
的 坐标 也 要 相应 地 进行 改变 。 而 在 另外 的 一 些 情景 中 ， 我 们 可 能 更 需要 
使 物体 仅 在 一 个 坐标 系 中 变换 ， 而 不 改变 其 参照 的 参考 系 。 





3.8 ”练习 


1， 设 Fr: 及 3 一 RR 的 定义 为 (7,y,;2) = 二 (7 十 y,7 一 3,2)。 那 么 ，7r 是 一 种 
线性 变换 吗 ? 如 果 是 ， 求 出 它 的 标准 矩阵 表示 。 





2， 设 Tt:R3 二 RR 的 定义 为 7(7,y,2) = 二 (37 十 4z,27 一 2z,T 十 Yy 十 2)。 那 
么 ，7 是 否 是 一 种 线性 变换 ? 如 果 是 ， 求 出 它 的 标准 矩阵 表示 。 





3. 设 7: 了 一 RR 是 一 种 线性 变换 ， 而 且 7(1,0,0) = (3,1,2), 
7(0,1,0) = (2,—1,3),，7(0,0,1) = (4,0,2), 求 7(1,1,1)。 


4. 构建 一 个 缩放 窍 阵 ， 使 物体 在 z 轴 方 同 上 放大 2 倍 ， 在 y 轴 方向 上 
放大 -3 倍 ， 在 > 轴 方 网 上 保持 不 变 。 

5. 构建 一 个 旋转 矩阵 ， 使 物体 绕 轴 (1 1 1) 旋 转 30°。 

6. 构建 一 个 平移 和 矩阵， 使 物体 沿 z 轴 正方 向 平移 4 个 单位 ， 在 y 轴 方 
问 保 持 不 变 ， 沿 z 轴 正方 同 平移 -9 个 单位 。 


7. 构建 一 个 单独 的 变换 和 矩阵， 首先 使 物体 在 z 轴 方向 上 放大 2 倍 ， 
在 y 轴 方向 上 放大 -3 倍 ， 在 : 轴 上 保持 不 变 。 接 着 将 物体 沿 z 轴 正方 向 平 
移 4 个 单位 ， 在 y 轴 上 保持 不 变 ， 沿 > 轴 正 方向 平移 -9 个 单位 。 

8. 构建 一 个 单独 的 变换 和 矩阵， 首先 令 物 体 绕 y 轴 旋转 45"。 接 着 使 之 
沿 z 轴 正方 向 平移 -2 个 单位 ， 沿 y 轴 正方 向 平移 5 个 单位 ， 最 后 沿 : 轴 正方 
向 平移 1 个 单位 。 





9. 重新 计算 例 3.2， 但 是 这 次 使 其 中 的 正方 形 在 z 轴 方向 上 放大 1.5 
倍 ， 在 y 轴 方向 上 缩小 至 0.75 倍 ， 在 z 轴 上 保持 不 变 。 最 后 ， 绘 制 出 变换 
前 后 的 几何体， 以 确定 所 得 到 结果 是 否 正确 。 








10. 重新 计算 例 3.3， 但 是 这 次 将 其 中 的 正方 形 统 y 轴 顺 时 针 方 回放 
转 -45”( 即 以 逆 时 针 方 向 旋 转 45") 。 最 后 ， 绘 制 出 变换 前 后 的 几何 体 ， 
验证 所 得 到 的 结果 。 


11. 重新 计算 例 3.4， 此 次 将 该 正方 形 在 z 轴 正方 向 平移 -5 个 单位 ， 
在 y 轴 正方 同 平移 -3.0 个 单位 ， 沿 z 轴 正方 同 平移 4.0 个 单位 。 最 后 ， 男 出 
变换 前 后 的 几何 体 ， 确 认 所 得 到 结果 的 正确 性 。 


12. 证 明 fenl v)=cosbv+ (lo cos0)(n: vn+tsing(n x vo) 是 一 种 线性 


变换 。 求 出 它 的 标准 和 矩阵 表示 。 








13. 证 明 怨 中 的 行 向 量 都 是 规范 正 交 的 。 作 为 拓展 ， 读 者 也 可 以 将 
此 性 质 推广 到 一 般 的 旋转 矩阵 ( 绕 任 意 轴 旋 转 的 旋转 矩阵 中。 





14. 证 明和 矩阵 M 是 正 交 矩阵， 当 且 仅 当 MT = M1!。 


15. 计算 : 


1 0 00 1 0 0 0 

0 1 00 ~ |I0 1 00 
TI, Y, 2, IT, Y, 2,0 
0 


pr b, pb 1 和 b: b, b. 1 








平移 矩阵 是 否 对 点 进行 了 平移 操作 ? 义 是 否 平移 了 回 量 ? 为 什么 对 








一 个 标准 位 置 上 的 向 量 坐标 进行 平移 是 没有 意义 的 ? 


16. 验证 文中 给 出 的 缩放 矩阵 的 逆 窍 阵 〈( 见 3.1.3 市 ) 确实 是 该 缩放 
和 窃 阵 的 逆 ; 这 可 以 直接 通过 矩阵 的 乘法 运算 SS = S 1S = 了 来 加 以 证 
明 。 类 似 地 ， 证 明文 中 给 出 的 平移 窍 阵 《〈 见 3.2.3 节 ) 的 逆 和 矩阵 确实 是 该 
平移 矩阵 的 逆 ， 即 证 明 TT- = TIT = 了 


17. 假设 我 们 已 知 标 架 4 和 标 架 B。 设 Pa = (1, 一 2 0) 和 94 = (1,2,0) 





分 别 表示 相对 于 标 架 4 的 一 个 点 和 一 个 作用 力 。 另 外 ， 设 QB = (6,2,0) 
站 贡 的 
UB 二 天 ,一 天; VB 二 1 一 .0 
, V2°W2E V2 V2”j/ 及 ws = (0.0,1) 描 述 的 是 标 架 上 





的 原点 与 3 个 坐标 轴 相 对 于 标 架 B 的 坐标 。 构 建 出 把 标 架 4 的 坐标 映 瑞 为 
标 架 B 的 坐标 的 变换 矩阵 ， 并 求 出 Psp = (TY) 和 948 = (7,y,?) 的 齐 次 华 
标 。 最 后 ， 将 变换 的 过 程 绘 制 在 图 纸 上 ， 以 验证 答案 的 正确 性 。 


18. 利用 点 来 对 照 问 量 的 线性 组 合 可 得 到 一 种 仿 册 组 合 (affine 
combination) : P 了 三 Pi 二 十 4npn， 其 中 1 二 … 二 an 二 1， 是 
PI， ,Pn 都 为 点 。 可 以 将 标量 系数 a 看 作 是 对 应 “点 ”的 权重 ， 用 于 描述 
Pk 对 P 的 影响 程度 。 笼 统 地 讲 ，a 越 接近 于 1， 则 p 越 趋 近 于 Pk， 而 负 的 a# 
则 使 Pp 与 Pe “背道而驰 ”。 下 一 道 练习 题 将 更 直观 地 说 明 这 一 点 。 满 足 上 
述 条 件 的 权 值 组 合 也 称 作 点 P 的 重心 坐标 (barycentric coordinate) 。 最 
后 ， 请 证 明 仿 射 组 合 可 以 写作 一 个 点 与 一 个 向 量 之 和 的 形式 : 





P= PI+a(py 一 到 1) + + an(p, — PI) 


19， 考虑 由 Pi = (0,0,0)，ps = (0,1,0) 和 Ps = (2,0,0) 这 3 个 点 所 构成 
的 三 角形 。 绘 制 出 下 列 点 : 


] ] 
Cay aP! 及 3P2™ 3P3 


(b) 0.7p1 + 0.2p, + 0.1p 
(c) 0.0P1 + 0.5po + 0.5P3 
(d) —0.2p1 +0.6p, + 0.6ps 
(@) 0.6P1 十 0.5Pp。 一 0.1p; 
(f) 0.8p1 一 0.3P + 0.5ps 


小 题 (a) 中 的 点 有 什么 特别 之 处 吗 ? 耕 按 仿 冉 组 合 公式 用 P1 
，P2z 和 Ps 三 点 来 表示 点 P2 和 点 (1,0,0)， 则 其 对 应 的 重心 坐标 分 别 是 多 
少 ? 如 采 重 心 坐 标 中 有 一 分 量 为 员 ， 那 么 ， 能 推测 出 此 对 应 点 P 与 三 角 
形 的 位 置 天 系 吗 ? 


20. 判断 一 个 仿 射 变换 的 决定 性 因素 之 一 便 是 要 满足 仿 射 组 合 。 证 
明 仿 射 变换 taw) 满 足 仿 射 组 合 ， 即 


GalPD1 十 … 十 anp,) = a1Q(DI ) 十 … .十 ana (Pp,), 其 中 al 十 …: 十 an 一 1 


21. 考 罕 图 3.16。 在 计算 机 图 形 学 里 ， 将 坐标 由 标 架 4 中 《正方 形 
-1,17) 映射 到 标 架 8B 中 正方 形 l0; 1]"， 其 中 的 y 轴 正方 向 与 标 架 4 中 的 y 
轴 正 方 回 正 相 反 〉 是 一 种 很 常见 的 坐标 变换 。 证 明 由 标 架 4 到 标 染 B 的 
这 种 坐标 变换 为 : 


0.5 0 U 0 


0 —0.5 0 0 1 / 
[z, y, 0, 1 0 0 10|= [Iz, y, 0, 1] 
0.5 0.5 0 1 





Gb-1) 





2 
. 


图 3.16 将 标 架 4 中 (正方 形 [ 一 1, 1]*) 的 坐标 映射 到 标 架 妃 〈 正 方形 0, 1] 
其 中 的 8 有利 正方 向 与 标 架 4 中 7 轴 正 方向 刚好 相反 ) 的 坐标 变换 




















22. 在 第 2 章 曾 提 到 : 在 线性 变换 下 ， 行 列 式 与 〈z 维 平行 多 面体 ) 
体积 (面积 ) 的 变化 有 关 。 请 求 出 缩放 和 窍 阵 的 行列 式 ， 并 从 体积 变化 的 
角度 来 对 此 进行 解释 。 





23. 思考 将 正方 形 扭曲 为 平行 四 边 形 的 变换 7: 


TtT, Y) = (37 + YY, T+ 2y) 





求 出 此 变换 的 标准 矩阵 表示 ， 并 证 明 变 换 和 矩阵 的 行列 式 与 由 7 和 
7(7) 张 成 的 平行 四 边 形 面积 相等 (参考 图 3.17)。 





+X 





图 3.17 将 正方 形 映射 为 平行 四 边 形 的 变换 











24. 证 明令 物体 绕 y 负 旋转 的 变换 矩阵 行列 式 为 1。 根 据 之 前 的 习 


题 ， 解 释 为 什么 此 值 为 1。 作 为 进一步 拓展 ， 读 者 也 可 以 证 明 : 一 般 旋 
转 和 矩阵 〈 令 物体 绕 任 意 轴 旋转 的 矩阵 ) 的 行列 式 旨 为 1。 


25. 我 们 可 以 将 任意 的 旋转 窍 阵 看 作 是 行列 式 为 1 的 正 交 矩阵 。 结 


合 图 3.7 与 习题 24 来 加 以 验证 便 会 发 现 这 一 点 。 旋 转 后 的 基 向 量 7(、 
7) 和 7 都 为 单位 长 度 ， 且 互相 正 交 ; 再 者 ， 由 于 旋转 变换 不 会 改变 
物体 的 大 小 ， 因 此 旋转 和 矩阵 的 行列 式 就 应 当 为 1。 请 证 明 两 个 旋转 矩阵 
的 乘积 Eee = 及 也 是 旋转 矩阵 。 即 证 明 RR' = Ri'R = 二 IT( 以 此 证 明 R 
是 正 交 第 阵 ) 5 从 及 detRR= 1 





26. 证 明 旋 转 矩 阵 尽 具有 下 列 性 质 : 





(a) (uuR):(vR)=u:v 点 积 不 变性 
(b) IuR|| = je 保 长 性 
(c) 9uR,vR) = 0(u,v) 保 角 性 ， 其 中 bz， vy) 
计算 的 是 z 与 y 之 间 的 夹 角 : 
中 TD.2) = arccos 人 
lzlllly|| 


解释 这 些 性 质 对 于 旋转 变换 的 意义 。 


27. 求 出 一 个 兼 有 缩放 、 旋 转 和 平移 操作 的 算 阵 ， 通 过 它 将 始 于 点 





P= (0,0,0)、 终 于 点 q = (0,0,1) 的 线段 变换 为 始 于 点 (3,1,2)、 平 行 于 向 量 


(1,1, 了 1) 且 长 度 为 2 的 线段 。 


28. 假设 有 一 中 心 位 于 坐标 (z, 多 z) 处 的 立方 体 。 若 定义 原点 为 缩放 
变换 的 参考 点 ， 那 么 ， 对 立方 体 〈 注 意 ， 它 的 中 心 此 时 并 非 位 于 原点 ) 
进行 缩放 处 理 便 会 产生 使 之 平移 的 “副作用 ”， 这 在 某 些 应 用 情景 中 是 我 
们 所 不 愿 看 到 的 。 因 此 ， 请 求 出 一 种 使 该 立方 体 相 对 于 其 中 心 点 进行 缩 
放 的 变换 。 


提示 @ 


首先 通过 坐标 变换 将 立方 体 转 换 至 原点 位 于 其 中 心 的 立方 体 坐标 
系 ， 对 立方 体 进行 绽放 处 理 后 ， 再 将 其 变换 回 起 始 坐标 系 ， 如 图 3.18 所 
示 。 


(3,3) 


(1,1) 





图 3.18 长方体 的 缩放 变换 
(a) 令 正 方形 相对 于 原点 在 Z 轴 方向 上 放大 两 倍 会 导致 变换 后 的 矩形 发 生平 移 
(b) 使 正方 形 相 对 于 自身 中 心 点 在 I 轴 方 向 上 放大 两 倍 则 不 会 使 变换 后 的 矩形 
发 生平 移 《〈 即 变换 后 的 矩形 中 心 点 仍 位 于 变换 前 正方 形 的 起 始 中 心 点 处 ) 





















































[1] 由 此 可 见 ， 这 里 采用 的 是 右手 坐标 系 ， 下 面 的 示例 亦 是 如 此 ， 但 
Direct3D 中 实际 采用 的 是 左手 坐标 系 。 


[2] 原文 为 “composition of transformations”， 也 有 译作 变换 的 组 合 等 。 


[3] 原文 为 change of coordinate transformation， 但 这 里 译作 坐标 系 变换 
或 许 更 贴切 。 





二 


第 二 部 分 “Direct3D 基 础 


在 这 一 部 分 中 ， 我 们 将 学 习 贯 穿 本 书后 续 和 内容 的 Direct3D 基 础 概念 
以 及 技术 。 掌 握 了 这 些 基 本 功 后 ， 我 们 就 能 写 出 更 加 有 趣 的 应 用 程序 。 
以 下 是 本 部 分 各 音 的 简介 。 








第 4 章 “Direct3D 的 初始 化 "这 一 章 将 市 领 读 者 进一步 理解 Direct3D 
并 学 习 如 何 对 它 进 行 初始 化 ， 为 后 续 的 3D 绘 图 工作 打 好 基础 。 另 外 ， 
也 会 介绍 一 些 Direct3D 的 基本 技术 主题 ， 例 如 表面 中 、 像 素 格式 (pixel 
format) 、 页 面 翻转 〈page flipping) 、 深 度 缓冲 〈depth buffering) 和 多 
重 采 样 (multisampling〉。 我 们 还 会 学 习 用 性 能 计数 器 (performance 
counter) 度量 时 间 ， 用 于 统计 每 秒 中 押 泻 染 的 帧 数 。 除 此 之 外 ， 还 会 给 
出 一 些 有 关 Direct3D 的 调试 小 穹 门 。 最 后 ， 我 们 会 开发 和 使 用 属于 自己 
的 应 用 程序 框架 一 一 当然 ， 这 并 不 是 指 SDK 框 染 。 








第 5 章 “ 演 染 流 水 线 ” 在 这 篇 幅 较 长 一 章 里 将 对 泻 染 流水 线 
(rendering pipeline〉 进 行 全 面 地 讲解 。 演 染 流 水 线 是 基于 虚拟 摄像 机 
(virtual camera) 的 视角 来 进行 观察 ， 并 据 此 生成 场景 2D 图 像 的 一 系列 
步骤 。 在 此 ， 我 们 将 学 习 定 义 3D 场 景 、 控 制 虚拟 摄像 机 ， 以 及 将 3D 几 
何 体 投 影 至 一 个 2D 图 像 的 平面 中 。 


第 6 章 “ 利 用 Direct3D 绘 制 几何 体 ” 这 一 章 将 关注 : 定义 3D 几 何 体 、 
配置 演 染 流水 线 、 创 建 顶 点 着 色 器 (vertex shader) 和 像素 着 色 器 


Cpixel shader) ， 以 及 辐 演 染 流水 线 提 交 用 于 绘制 的 几何 体 等 操作 相关 
的 Direct3D API 接 口 与 方法 。 结 束 本 章 的 学 习 后 ， 我 们 将 能 够 绘制 一 个 
3D 立 方 体 并 从 不 同 的 角度 来 观赏 它 。 





第 7 章 “ 利 用 Direct3D 绘 制 几何 体 〈 续 ) ”这 一 章 将 介绍 本 书后 续 要 
用 到 的 几 种 绘制 模式 。 借 助 优化 CPU 与 GPU 之 间 的 工作 负载 平衡 ， 引 出 
重新 组 织 绘制 物体 的 演 染 流程 这 一 主题 。 本 章 最 后 将 展示 怎样 泻 染 出 更 
为 复 森 的 物体 ， 如 栅 格 、 球 体 、 立 柱 乃 至 模拟 动态 的 波浪 。 














第 8 章 “ 光 照 >? 这 一 章 展示 了 光源 的 创建 过 程 ， 并 定义 了 光 与 不 同 材 
质 表面 之 间 的 交互 。 在 此 ， 我 们 还 特别 演示 了 如 何 用 顶点 着 色 器 和 像素 
着 色 器 来 实现 平行 光 光 源 (directional lights) 、 点 光源 (point lights) 
和 聚光灯 光源 (spot lights) 。 





第 9 对 “纹理 贴图 ”这 一 章 描 述 了 纹理 贴图 (texture mapping) ， 这 是 
一 种 通过 将 2D 图 像 数 据 映射 到 3D 图 元 上 、 继 而 使 场景 更 加 真实 的 技 
术 。 例 如 ， 运 用 纹理 贴图 ， 我 们 就 可 以 把 2D 砖 块 的 图 片 应 用 到 一 个 3D 
立方 体 的 表面 ， 以 此 来 模拟 砖 块 。 其 他 关键 的 纹理 主题 也 将 在 这 一 章 讲 
授 ， 其 中 包括 纹理 平 铺 (texture tiling〉 和 动态 纹理 变换 (animated 


texture transformation) 。 





第 10 间 “混合 ”利用 混合 (blending) 技术 ， 我 们 便 可 以 实现 许多 如 
透明 度 (transparency) 这 样 的 特效 。 另 外 ， 我 们 将 在 这 一 章 探讨 HLSL 
内 置 的 裁 斑 函数 (dlip〉， 通 过 它 便 可 以 从 可 视 的 图 像 中 掩盖 住 指定 的 
部 分 ， 比 如 说 ， 此 函数 可 用 于 绘制 铁丝 网 和 门 等 物体 。 男 外 ， 本 章 还 会 








展示 如 何 实现 雾 的 效果 。 


第 11 章 “模板 ”这 一 章 介 绍 了 模板 缓冲 区 (stencil buffer) ， 顾 名 思 
义 ， 它 就 像 是 一 块 “ 模 板 ”， 人 允许 我 们 阻止 特定 像素 的 绘制 操作 。 而 且 ， 
这 种 遮 汗 像素 的 技术 在 各 种 情况 下 都 适用 。 为 了 使 读者 充分 理解 本 章 的 
主题 ， 我 们 将 深入 研究 用 模板 绥 冲 区 实现 平面 反射 〈planar reflection ) 
和 平面 阴影 (planar shadow) 的 方法 。 











第 12 章 “几何 着 色 器 ”这 一 章 展示 了 如 何 编写 几何 着 色 器 (geometry 
shader) 。 几 何 着 色 器 比较 特殊 ， 因 为 它 可 以 创建 和 销毁 整个 几何 图 元 
(geometric primitive) 。 几 何 着 色 器 的 常见 应 用 场合 有 公告 牌 
(billboard ) 、 毛 发 演 染 (fur rendeing) 、 细 分 (subdivision) 和 粒子 系 
统 〈particle system) 。 另 外 ， 这 一 章 还 痔 释 了 图 元 ID 和 纹理 数组 


(texture array) 等 概念 。 











第 13 章 “计算 着 色 器 ”计算 着 色 器 (compute shader) 是 一 种 可 编程 
着 色 器 。Direct3D 提 供 的 计算 着 色 器 并 非 直属 于 泻 染 流水 线 。 通 过 它 即 
可 将 图 形 处 理 器 (GPU) 应 用 于 通用 计算 (general purpose 
computation) 。 例 如 ， 一 天 图 像 应 用 软件 可 以 利用 计算 着 色 器 ， 实 现 
GPU 对 图 像 处 理 算法 的 加 速 。 由 于 计算 着 色 器 是 Direct3D 的 一 部 分 ， 所 
以 它 的 读 写 操作 都 依赖 于 Direct3D 的 资源 。 这 样 一 来 ， 我 们 就 可 以 直接 
把 计算 结果 整合 到 泻 染 流水 线 中 。 因 此 ， 除 了 通用 计算 以 外 ， 计 算 着 色 
器 依然 可 用 于 3D 演 染 。 

















第 14 章 “曲面 细 分 阶段 > 这 一 章 将 探索 渔 染 流水 线 的 曲面 细 分 阶段 


《tessellation stage) 。 利 用 这 个 阶段 中 的 镶 舱 技术 便 能 够 将 几何 体 细 分 
为 更 小 的 三 角形 ， 接 着 再 以 某 种 方式 对 新 生成 的 项 点 进行 偏 移 。 其 中 ， 
增加 三 角形 数量 的 动机 是 使 网 格 增添 细节 。 本 章 将 详解 这 项 技术 的 工作 
原理 ， 我 们 会 展示 怎样 根据 四 边 形 面 片 的 观察 距离 来 对 它 进行 镶 摧 化 处 
理 ， 也 将 演示 如 何 来 泻 染 三 次 贝 窟 尔 四 边 形 面 片 的 表面 。 

















[1] 原文 为 surface。 在 Direct3D 中 ， 表 面 (surface， 不 要 与 “物体 表 
面 ? 混 消 ) 这 一 术语 表示 显存 〈 尽 省 表面 也 可 位 于 系统 内 存 ， 但 这 里 通 
常 指 代 的 是 显存 端 ) 中 的 一 块 线性 区 域 。 这 个 词 在 DirectX 9 时 期 比较 常 
见 ， 但 在 DirectX 12 文 档 中 很 少 被 提 及 ， 可 认为 是 各 种 缓冲 区 、 纹 理 等 
2D 资 源 的 一 种 低层 抽象 或 旧 代 名 词 。 








第 4 章 ”Direct3D 的 初始 化 


为 了 理解 Direct3D 的 初始 化 过 程 ，4.1 节 和 4.2 节 将 用 来 讲述 我 们 需 
要 熟悉 的 一 些 相关 知识 ， 如 Direct3D 中 的 数据 类 型 和 基础 的 图 形 学 概 
念 。 接 下 来 ， 我 们 会 继续 深入 Direct3D 初 始 化 步 又 的 具体 细节 。 随 后 我 
们 会 留 出 一 些 篇 幅 来 探讨 实时 图 形 应 用 所 需要 的 精确 计时 和 时 间 度 量 。 
最 后 ， 我 们 将 研究 示例 的 框架 代码 ， 它 为 本 书后 续 的 演示 程序 提供 了 统 
一 的 接口 。 


学 习 目 标 : 
1. 了 解 Direct3D 在 3D 编 程 中 相对 于 硬件 所 扮演 的 角色 。 
2. 理解 组 件 对 象 模型 COM 在 Direct3D 中 起 到 的 作用 。 


3. 掌握 基础 的 图 形 学 概念 ， 例 如 2D 图 像 的 存储 方式 、 页 面 翻转 、 
深度 缓冲 、 多 重 采 样 以 及 CPU 与 GPU 之 间 的 交互 。 


4. 学 习 使 用 性 能 计数 器 函数 ， 以 此 读 取 高 精度 计时 器 的 数值 。 
5. 了 解 Direct3D 的 初始 化 过 程 。 


6. 熟悉 本 书 应 用 程序 框 染 的 整体 结构 ， 我 们 在 后 续 的 演示 程序 中 
忆 会 见 到 它 的 里 影 。 


4.1 预备 知识 


要 学 习 Direct3D 的 初始 化 流程 ， 我 们 还 需要 了 解 一 些 基 本 的 图 形 学 
概念 以 及 Direct3D 中 稍 用 数据 类 型 的 相关 知识 。 本 节 将 着 重 介 绍 这 些 内 
容 ， 以 防 在 后 面 讲 解 Direct3D 的 初始 化 流程 时 被 这 些 细 村 末节 哈 宾 竺 
主 。 





4.1.1 Direct3D 12 概 述 


通过 Direct3D 这 种 底层 图 形 应 用 程序 编程 接口 (Application 

Programming Interface，API)〉， 即 可 在 在 应 用 程序 中 对 图 形 处 理 器 

(Graphics Processing Unit，GPU) 进行 控制 和 编程 。 我 们 能 够 借 此 以 
人 硬件 加 速 的 方式 泻 染 出 虚拟 的 3D 场 景 。 例 如 ， 寿 要 疝 GPU 提 交 一 个 清 
除 某 泻 染 目标 由 《如 清 屏 ) 的 命令 ， 我 们 就 可 以 调用 Direct3D 中 的 
ID3D12GraphicsCommandList::ClearRenderTargetView 方 法 喇 。 
随后 ，Direct3D 层 和 硬件 驱动 会 协作 将 此 Direct3D 命 令 转 换 为 系统 中 
GPU 可 以 执行 的 本 地 机 器 指令 。 这 就 是 说 ， 只 要 GPU 文 持 当前 所 用 的 
Direct3D 版 本 ， 我 们 就 无 须 再 考虑 它 的 有 具体 规格 和 硬件 控制 层面 的 实现 
细节 。 为 此 ，GPU 的 生产 厂商 如 NVIDIA、Intel 和 AMD 等 公司 就 必须 与 
Direct3D 团 队 一 同 合作 ， 为 用 户 提 供与 Direct3D 设 备 相 兼容 的 驱动 。 


除了 添加 一 些 新 的 泻 染 特 性 以 外 ，Direct3D 12 经 重新 设计 已 焕然 一 
新 ， 较 之 上 一 个 版 本 的 主要 改变 在 于 其 性 能 优化 方面 在 大 大 减少 了 CPU 


开销 的 同时 ， 又 改进 了 对 多 线程 的 支持 。 为 了 达到 这 些 性 能 目标 ， 
Direct3D 12 的 API 较 Direct3D 11 更 偏 于 底层 。 男 外 ，API 抽 象 程度 的 降低 
使 它 更 趋 于 具体 化 ， 与 现代 GPU 的 构架 也 更 为 契合 ， 因 此 也 就 促使 开发 
者 要 付出 比 苦 日 更 多 的 努力 。 当 然 ， 使 用 这 种 更 复杂 的 API 所 得 到 的 回 
报 是 : 性 能 的 提升 。 





4.1.2 ”组 件 对 象 模型 


组 件 对 象 模 型 (Component Object Model，COM) 是 一 种 令 DirectX 
不 受 编程 语言 束缚 ， 并 且 使 之 同 后 兼容 的 技术 。 我 们 通常 将 COM 对 象 
视 为 一 种 接口 ， 但 考虑 当前 编程 的 目的 ， 遂 将 它 当 作 一 个 C++ 类 来 使 
用 。 用 C++ 语言 编写 DirectX 程 序 时 ，COM 帮 有 我 们 隐藏 了 大 量 底层 细 
节 。 我 们 只 需 知道 : 要 获取 指向 某 COM 接 口 的 指针 ， 需 借助 特定 函数 
或 另 一 COM 接 口 的 方法 一 一 而 不 是 用 C++ 语言 中 的 关键 字 new 去 创建 一 
个 COM 接 口 。 另 外 ，COM 对 象 会 统计 其 引用 次 数 : 因 此， 在 使 用 完 某 
接口 时 ， 我 们 便 应 调用 它 的 Release 方 法 (COM 接口 的 所 有 功能 都 是 从 
IUnknown 这 个 COM 接 口 继承 而 来 的 ， 包 括 Release 方 法 在 内 ) ， 而 不 
是 用 delete 来 删除 一 一 当 COM 对 和 象 的 引用 计数 为 0 时 ， 它 将 自行 释放 自 
己 所 占用 的 内 存 。 











为 了 辅助 用 户 管理 COM 对 象 的 生命 周期 ，Windows 运 行 时 库 
(Windows Runtime Library，WRL ) 专门 为 此 提供 了 
Microsoft: :WRL: :ComPtr 类 (#include <wrl.h>) ， 我 们 可 以 把 它 
当 作 是 COM 对 象 的 智能 指针 。 当 一 个 ComPtr 实 例 超出 作用 域 范 围 时 ， 


它 便 会 自动 调用 相应 COM 对 象 的 Release 方 法 ， 继 而 省 掉 了 我 们 手动 调 
用 的 麻烦 。 本 书 中 常用 的 3 个 ComPtr 方 法 如 下 。 


1. Get: 返回 一 个 指向 此 底层 COM 接 口 的 指针 。 此 方法 常用 于 把 
原始 的 COM 接 口 指针 作为 参数 传递 给 函数 。 例 如 : 


CompPtr<ID3D12RootSignature> mRootSignature; 





// SetGraphicsRootSignature 需 要 获取 ID3D12RootSignature* 类 型 的 参数 
mCommandList->SetGraphicsRootSignature(mRootSignature.Get()); 





2. GetAddress0f: 返回 指 癌 此 底层 COM 接 口 指针 的 地 址 。 任 此 
方法 即 可 利用 函数 参数 返回 COM 接 口 的 指针 。 例 如 : 


Comptr<ID3D12CommandAllocator> mDirectCmdListAlloc; 


ThrowIfFailed(md3dDevice->CreateCommandAllocator( 
D3D12 COMMAND LIST_TYPE_DIRECT, 
mDirectCmdListAlloc.GetAddressOof())); 





3. Reset: 将 此 ComPtr 实 例 设置 为 nullptr 释 放 与 之 相关 的 所 有 
引用 (同时 减少 其 底层 COM 接 口 的 引用 计数 ) 。 此 方法 的 功能 与 
将 ComPtr 目 标 实例 赋值 为 nullptr 的 效果 相同 。 


当然 ， 与 COM 有 关 的 知识 并 不 止 于 此 ， 但 是 对 有 效 地 使 用 DirectX 
来 说 足 全。 


COM 接 口 都 以 大 写字 母 “IT?" 作 为 开头 。 例 如 ， 表 示 命 令 列 表 的 COM 
接口 为 ID3D12GraphicsCommandList。 


4.1.3 ”纹理 格式 


2D 纹 理 (2D texture) 是 一 种 由 数据 元 素 构 成 的 矩阵 (可 将 此 “ 知 
阵 ” 看 作 2D 数 组 ) 。 它 的 用 途 之 一 是 存储 2D 图 像 数据 ， 在 这 种 情况 下 ， 
纹理 中 每 个 元 素 存 储 的 都 是 一 个 像素 的 颜色 。 然 而 ， 纹 理 的 用 处 并 非 
仅 此 而 已 。 例 如 ， 有 种 称 作法 线 贴 图 (normal mapping) 的 高 级 技术 ， 
其 纹理 内 的 每 个 元 素 存储 的 就 是 一 个 3D 向 量 而 不 是 颜色 信息 。 因 此 ， 
尽管 纹理 给 人 的 第 一 印象 通常 是 用 来 存储 图 像 数 据 ， 但 其 实际 用 途 却 十 
分 广泛 。 简 单 来 讲 ，1D、2D、3D 纹 理 就 相当 于 特定 数据 元 素 所 构成 
1D、2D、3D 数 组 。 但 随 着 后 续 草 节 中 对 纹理 讨论 的 逐渐 深入 ， 我 们 便 
会 知道 ， 纹 理 其 实 还 不 只 是 像 “ 数 据 数 组 ”那样 简单 。 它 们 可 能 还 具有 多 
种 mipmap 层 级 向 ， 而 GPU 则 会 据 此 对 它们 进行 特殊 的 处 理 ， 例 如 运用 过 
滤器 (filter) 和 进行 多 重 采样 multisample) 。 另 外 ， 并 不 是 任意 类 型 
的 数据 元 素 都 能 用 于 组 成 纹理 ， 它 只 能 存储 DXGI_FORMAT 枚 举 类 型 中 描 
述 的 特定 格式 的 数据 元 素 。 下 面 是 一 些 相关 的 格式 示例 : 














1. DXGI_FORMAT_R32G32B32_FLOAT: 每 个 元 素 由 3 个 32 位 浮 点 数 
分 量 构成 。 


2. DXGI_FORMAT_R16G16B16A16_UNORM: 每 个 元 素 由 4 个 16 位 分 


量 构成 ， 每 个 分 量 都 被 映射 到 [0, 1] 区 间 。 


3. DXGI_FORMAT_R32G32_UINT: 每 个 元 素 由 2 个 32 位 无 符号 整数 
分 量 构成 。 
4. DXGI_FORMAT_R8G8B8A8_UNORM: 每 个 元 素 由 4 个 8 位 无 符号 分 


量 构成 ， 每 个 分 量 都 被 映射 到 [0, 1] 区 间 。 


5. DXGI_FORMAT_R8G8B8A8_SNORM: 每 个 元 素 由 4 个 8 位 有 符号 分 
量 构成 ， 每 个 分 量 都 被 映射 到 [-1 1] 区 间 。 


6. DXGI_FORMAT_R8G8B8A8_SINT: 每 个 元 素 由 4 个 8 位 有 符号 整 
数 分 量 构成 ， 每 个 分 量 都 被 映射 到 [-128, 127] 区 间 。 


7. DXGI_FORMAT_R8G8B8A8_UINT: 每 个 元 素 由 4 个 8 位 无 符号 整 
数 分 量 构成 ， 每 个 分 量 都 被 映射 到 [0, 255] 区 间 。 





注意 ， 大 写字 母 R、G、B、A 分 别 表 示 红 色 (red) 、 绿 色 
(green) 、 蓝 色 (blue) 和 alpha。 上 所 有 的 颜色 都 是 由 红 、 绿 、 蓝 三 基 
色 吕 组合 而 成 〈 例 如 ， 红 色 和 绿色 混合 成 黄色 ) 。alpha 通 道 (或 称 为 
alpha 分 量 ) 则 通 利 用 于 控制 透明 度 。 然 而 ， 正 如 前 文 所 述 ， 尽 管 格式 名 
称 在 字面 上 指示 的 是 颜色 和 alpha 值 ， 但 纹理 存储 的 却 不 一 定 是 颜色 信 
息 。 例 如 ， 格 式 


DXGI_FORMAT_R32G32B32_FLOAT 


中 含有 3 个 浮 后 数 分 量 ， 因 此 可 以 利用 坐标 格式 为 浮 扣 数 的 方式 存 





储 任意 3D 同 量 。 除 此 之 外 ， 亦 有 无 类 型 (typeless) 格式 的 纹理 ， 我 们 
仪 用 它 来 预 留 内 存 ， 待 纹理 被 绑 定 到 泻 染 流水 线 (rendering pipeline， 
详 见 第 5 章 ) 之 后 ， 再 具体 解释 它 的 数据 类 型 《有 点 像 C++ 语 言 里 的 强 
制 转 换 加 ) 。 例 如 ， 下 面 的 无 类 型 格式 保留 的 是 由 4 个 16 位 分 量 组 成 的 
元 素 ， 但 并 没有 指出 数据 的 具体 类 型 (例如 ， 是 整数 、 浮 点 数 还 是 无 符 


号 整数 ? ) : 


DXGI_FORMAT_R16G16B16A16_TYPELESS 


我 们 将 在 第 6 章 中 看 到 DXGI_FORMAT 枚 举 类 型 也 可 用 于 描述 顶点 以 
及 索引 的 数据 格式 。 


4.1.4 交换 链 和 页 面 翻 转 


为 了 避免 动画 中 出 现 画 面 内 烁 的 现象 ， 最 好 将 动画 帧 完整 地 绘制 在 
一 种 称 为 后 台 绥 冲 区 的 离 屏 〈off-screen， 即 不 可 直接 呈现 在 显示 设备 上 
之 意 ) 纹理 内 。 只 要 将 指定 动画 帧 的 整个 场景 绘 到 后 台 绥 冲 区 中 ， 它 就 
会 以 一 个 完整 的 帧 画面 展现 在 屏幕 上 ; 依照 此 法 ， 观 者 便 不 会 察觉 出 帧 
的 绘制 过 程 一 一 而 只 会 观赏 到 完整 的 动画 帧 。 为 此 ， 需 要 利用 由 人 硬件 管 
理 的 两 种 纹理 缓冲 区 : 即 所 谓 的 前 台 绥 冲 区 (front buffer) 和 后 人 台 绥 冲 
区 (back buffer〉 。 前 台 绥 冲 区 存储 的 是 当前 显示 在 屏幕 上 的 图 像 数 
据 ， 而 动画 的 下 一 帧 则 被 绘制 在 后 台 绥 冲 区 里 。 当 后 台 绥 冲 区 中 的 动画 
帧 绘制 完成 之 后 ， 两 种 缓冲 区 的 角色 互 换 : 后 台 绥 冲 区 变 为 前 台 绥 冲 区 
呈现 新 一 帧 的 画面 ， 而 前 台 绥 冲 区 则 为 了 展示 动画 的 下 一 帧 转 为 后 台 绥 
冲 区 ， 等 待 填充 数据 。 前 后 台 绥 冲 的 这 种 互 换 操 作 称 为 呈现 






































(presenting， 亦 有 译作 提交 、 显 示 等 ) 。 呈 现 是 一 种 高 效 的 操作 ， 只 需 
区 换 指向 当前 前 人 台 绥 冲 区 和 后 人 台 绥 冲 区 的 两 个 指针 即 可 实现 。 图 4.1 详 
细 地 解释 了 这 个 过 程 。 

第 "村 第 n+1 下 第 +2 由 
前台 缓冲 区 指针 。 | 组 六 ; 


后 台 缓 冲 区 指针 


















图 4.1 ”对 于 第 几 帧 来 讲 ， 当 前 显示 的 是 绥 冲 区 A 中 的 内 容 ， 我 们 将 把 下 一 帧 的 数据 演 染 到 此 时 
的 后 人 台 缓 冲 区 B 内 。 一 旦 后 台 绥 冲 区 绘制 完毕 ， 两 个 缓冲 区 的 指针 将 互 换 ， 即 缓冲 区 B 将 变 成 前 
台 绥 冲 区 ， 而 缓冲 区 A 则 成 为 新 的 后 台 绥 冲 区 。 接 下 来 ， 我 们 会 把 下 一 帧 的 内 容 泻 染 到 绥 冲 区 A 
中 。 待 后 台 绥 冲 区 〈 即 此 时 的 缓冲 区 A) 完成 绘制 ， 两 个 缓冲 区 的 指针 再 次 互 换 ， 即 在 第 十 2 

帧 中 ， 绥 冲 区 A 重 新 成 为 前 台 绥 冲 区 ， 绥 冲 区 B 则 再 次 客串 后 台 绥 冲 
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前 台 缓 冲 区 和 后 台 绥 冲 区 构成 了 交换 链 (swap chain) ， 在 
Direct3D 中 用 IDXGISwapChain 接 口 来 表示 。 这 个 接口 不 仅 存 储 了 前 台 
缓冲 区 和 后 台 绥 冲 区 两 种 纹理 ， 而 且 还 提供 了 修改 缓冲 区 大 小 

(IDXGISwapChain::ResizeBuffers) 和 呈现 缓冲 区 内 容 
CIDXGISwapChain: :Present) 的 方法 。 





使 用 两 个 缓冲 区 《前 台 和 后 台 ) 的 情况 称 为 双 绥 冲 (double 
buffering， 亦 有 译作 双重 缓冲 、 双 倍 绥 冲 等 ) 。 当 然 ， 也 可 以 运用 更 多 
的 缓冲 区 。 例 如 ， 使 用 3 个 缓冲 区 就 叫 作 三 重 缓冲 (triple buffering， 亦 
有 译作 三 倍 缓冲 等 四) 。 对 于 一 般 的 应 用 来 说 ， 使 用 两 个 缓冲 区 就 足够 
由 生 


注 意 Note Ce 


尽管 后 台 绥 冲 区 是 一 个 纹理 (因而 构成 纹理 的 基本 元 素 义 称 纹 系 ， 
texel) ， 但 我 们 仍 常 将 其 组 成 元 系 称 为 像 系 ， 因 为 加 后 台 绥 冲 区 这 种 情 
况 而 言 ， 它 所 存储 的 内 容 是 颜色 信息 。 即 便 纹理 中 存储 的 不 是 颜色 信 
息 ， 大 家 有 时 也 称 纹理 的 元 素 为 像素 〈 如 “法 线 图 中 的 像素 ") 名。 





4.1.5 ”深度 缓冲 


深度 缓冲 区 (depth buffer) 这 种 纹理 资源 存储 的 并 非 图 像 数据 ， 而 
是 特定 像素 的 深度 信息 。 深 度 值 的 范围 为 0.0~~1.0。0.0 代 表 观 察 者 在 视 
锥 体 (view frustum， 亦 有 译作 视 域 体 、 视 景 体 、 视 截 体 或 视 体 等 ， 意 
即 观察 者 能 看 到 的 空间 范围 ， 形 如 从 四 棱锥 中 截取 的 四 校 台 ， 常 称 该 形 
为 平 截 头 体 〈frustutm， 见 图 4.3， 后 文 亦 有 详 述 ) ) 中 能 看 到 离 自 己 最 
近 的 物体 ，1.0 则 代表 观察 者 在 视 锥 体 中 能 看 到 离 自 己 最 远 的 物体 。 深 
度 缓 冲 区 中 的 元 素 与 后 台 绥 冲 区 内 的 像素 呈 一 一 对 应 关系 〈 即 后 台 绥 冲 
区 中 第 ; 行 第 7 列 的 元 素 对 应 于 深度 缓冲 区 内 第 ; 行 第 7 列 的 元 素 ) 。 所 
以 ， 如 果 后 台 绥 冲 区 的 分 辨 率 为 1280 x 1024， 那 么 深度 缓冲 区 中 就 应 当 
有 1280 x 1024 个 深度 元 素 。 





图 4.2 展 现 了 一 个 简单 的 场景 ， 其 中 ， 后 侧 物体 的 局 部 区 域 被 其 他 
物体 押 遮 挡 。 为 了 确定 不 同 物体 间 的 像素 前 后 顺序 ，Direct3D 采 用 了 一 
种 叫 作 深 度 缓冲 (depth buffering) 或 z 绥 冲 〈z-buffering， 其 中 的 z 指 z 举 


标 ) 的 技术 。 这 里 要 着 重 强调 一 个 细节 : 若 使 用 了 深度 缓冲 ， 则 物体 的 
绘制 顺序 也 就 变 得 无 关 紧 要 了 。 











图 4.2 一 组 互 有 廊 挡 的 物体 


针对 深度 问题 的 处 理 ， 有 读者 可 能 会 提出 : 不 妨 将 场景 中 的 物体 按 
由 远 及 近 的 顺序 来 绘制 。 照 这 种 方式 ， 远 处 的 物体 束 会 被 近 处 的 物体 所 
履 兰 ， 并 演 染 出 正确 效果 。 这 其 实 束 是 画家 绘制 景物 的 方法 。 然 而 ， 这 
种 方法 其 实 也 有 它 自 己 的 缺陷 一 一 绘制 过 程 中 ， 不 仅 需要 对 大 量 的 数据 
按 从 后 至 前 的 绘制 顺序 进行 排序 ， 而 且 还 涉及 几何 体 相 交 的 问题 。 较 之 
这 种 处 理 方式 ， 图 形 硬 件 还 特别 提供 了 深度 缓冲 供 开 发 者 自由 使 用 ， 对 
此 ， 我 们 何 乐 而 不 为 呢 ? 


























为 了 对 深度 缓冲 的 工作 原理 有 更 深入 的 了 解 ， 让 我 们 来 看 一 个 例 
子 。 如 图 4.3 所 示 ， 图 中 展示 了 观察 者 看 到 的 立体 空间 ， 以 及 该 立体 空 
间 的 2D 侧 视图 。 从 图 中 可 以 看 到 ， 有 3 种 不 同 物体 的 像 系 都 争 看 泻 染 在 
观察 窗口 内 的 像 系 PP 上 (我们 当然 知道 离 观 察 者 最 近 的 像素 会 被 泻 染 到 
像素 已 ， 因 为 它 会 误 住 后 面 所 有 物体 的 对 应 像 系 。 但 是 计算 机 却 不 知 
道 ) 。 在 开始 泻 染 之 前 ， 后 台 绥 冲 区 会 被 清理 为 默认 颜色 ， 深 度 缓 冲 区 
也 将 被 清除 为 默认 值 一 一 通常 为 1.0《〈 即 像素 能 够 取 到 的 最 远 深度 
值 )。 现 在 ， 假 设 这 些 物 体 的 演 染 顺序 依次 为 圆柱 体 球体 -圆锥 体 。 
下 面 的 列表 总 结 了 像素 已 和 它 对 应 的 深度 值 d 按 物体 的 绘制 顺序 依次 更 新 
的 过 程 。 类 似 的 处 理 流程 也 发 生 在 其 他 像素 上 。 


























图 4.3 ”为 3D 场 景 生成 位 于 观察 窗口 内 对 应 2D 图 像 〈 后 台 缓 冲 区 ) 的 过 程 。 可 以 看 出 ， 图 中 有 3 

个 不 同 的 像素 争 着 投影 在 像素 已 上 。 直 觉 告诉 我 们 ， 像 素 刀 理应 被 写 到 已 内 ， 因 为 它 离 观 察 者 

最 近 ， 会 速 挡住 其 后 的 另外 两 个 同位 像素 。 深 度 缓冲 区 算法 为 计算 机 确定 像素 已 提供 了 一 种 机 

械 化 的 处 理 流程 。 注 意 ， 这 里 讨论 的 深度 值 是 相对 于 被 观测 的 3D 场 景 来 说 的 ， 而 深度 缓冲 区 中 
所 存 的 实际 深度 值 范围 为 0-0; 1-0 
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操作 步骤 | 人 ld 步骤 叙述 





清除 缓冲 区 
操作 








对 像素 及 其 对 应 的 深度 元 素 进 行 初始 化 








因为 43 4 二 1.0， 深 度 测试 通过 ， 更 新 缓冲 区 ， 使 
P 一 Ps, d 一 aa 








绘制 圆柱 体 











因为 d1 人 4 二 d3， 深 度 测试 通过 ， 更 新 缓冲 区 ， 使 
1 Pi, d = dl 


绘制 圆锥 体 因为 d2 > d = 四， 深度 测试 失败 ， 不 更 新 缓冲 区 




















可 以 看 出 ， 只 有 找到 具有 更 小 深度 值 的 像素 ， 才 会 对 观察 窗口 内 的 
像素 及 其 位 于 深度 缓冲 区 中 的 对 应 深度 值 进行 更 新 。 按 照 这 种 方法 逐步 
处 理 ， 竺 完成 所 有 的 比较 和 更 新 工作 后 ， 最 终 得 到 演 染 的 即 为 距离 观察 
者 最 近 的 像素 〈 如 采 读 者 仍 对 此 法 感到 将 信 将 疑 ， 可 以 洽 试 更 改 儿 何 体 
的 绘制 顺序 ， 再 依 上 述 表格 的 方法 一 步 步 重新 推导 ) 。 








总 而 言 之 ， 深 度 缓 冲 技术 的 原理 是 计算 每 个 像素 的 深度 值 ， 并 执行 
深 友 测试 depth test〉。 而 深度 测试 则 用 于 对 苋 争 写 入 后 台 绥 冲 区 中 辐 
一 像素 的 多 个 像素 深度 值 进行 比较 。 具 有 最 小 深度 值 的 像素 〔 说 明 该 像 
素 离 观察 者 最 近 ) 会 获得 最 终 的 胜利 ， 它 将 被 写 入 后 台 绥 冲 区 中 。 这 样 
做 也 是 合 卑 情理 的 ， 因 为 离 观察 者 较 近 的 像素 无 疑 会 谴 挡 其 后 面 的 像 




















深度 缓冲 区 也 是 一 种 纹理 ， 所 以 一 定 要 用 明确 的 数据 格式 来 创建 
它 。 深 度 缓 冲 可 用 的 格式 包括 以 下 几 种 。 


1. DXGI_FORMAT_D32 FLOAT_S8X24_UINT: 该 格式 共 占 用 64 位 ， 
取 其 中 的 32 位 指定 一 个 浮 点 型 深度 缓冲 区 ， 另 有 8 位 〈 无 符号 整数 ) 分 
配给 模板 缓冲 区 (stencil buffer) ， 并 将 该 元 素 映 射 到 [0, 255] 区 间 ， 简 
下 的 24 位 仅 用 于 填充 对 齐 (padding)〉 不 作 他 用 。 


2. DXGI_FORMAT_D32_FLOAT: 指定 一 个 32 位 浮 点 型 深度 缓冲 区 。 





3. DXGI_FORMAT_D24_UNORM _S8_UINT: 指定 一 个 无 符号 24 位 深 
度 绥 冲 区 ， 并 将 该 元 素 映 射 到 [0, 1] 区 间 。 另 有 8 位 〈 无 符号 整 型 ) 分 配 
给 模板 缓冲 区 ， 将 此 元 素 映 射 到 [0, 255] 区 间 。 





4. DXGI_FORMAT_D16_UNORM: 指定 一 个 无 符号 16 位 深度 缓冲 区 ， 
把 该 元 素 映 射 到 [0, 1] 区 间 。 


一 个 应 用 程序 不 一 定 要 用 到 模板 缓冲 区 。 但 一 经 使 用 ， 则 深度 缓冲 
区 将 总 是 与 模板 缓冲 区 如 影 随 形 ， 共 同 进退 。 例 如 ，32 位 格式 


DXGI_FORMAT_D24 UNORM S8_UINT 


使 用 24 位 作为 深度 缓冲 区 ， 其 他 8 位 作为 模板 缓冲 区 。 出 于 这 个 原 
因 ， 深 度 缓 冲 区 叫 作 深 度 / 模 板 缓冲 区 更 为 得 体 。 模 板 缓冲 区 的 运用 是 


更 高 级 的 主题 ， 在 第 11 章 中 会 有 相应 的 介绍 。 


4.1.6 ”资源 与 描述 符 


在 泻 染 处 理 的 过 程 中 ，GPU 可 能 会 对 资源 进行 读 ( 例 如， 从 插 述 物 
体 表面 样 貌 的 纹理 或 者 存 有 3D 场 景 中 几何 体位 置信 息 的 缓冲 区 中 读 取 
数据 ) 和 写 〈 人 例如， 向 后 台 组 冲 区 或 深度 /模板 绥 冲 区 写 入 数据 ) 两 种 
操作 。 在 发 出 绘制 命令 之 前 ， 我 们 需要 将 与 本 次 I (draw call) 
相关 的 资源 绑 定 〈bind 或 称 链接 ，link) 到 演 染 流水 线 上 。 部 分 资源 可 
人 ea 

| GPU 资源 并 非 直接 与 泻 染 流 水 线 相 绑 定 ， 而 是 要 通过 一 种 名 
守 (descriptor〉 的 对 象 来 对 它 间 接 引 用 ， 我 们 可 以 把 摘 述 符 视 为 
as 的 轻 量 级 结构 。 从 本 质 上 来 讲 ， 它 实际 
上 即 为 一 个 中 间 层 ， 寿 指定 了 资源 描述 符 ，GPU 将 既 能 获得 实际 的 资源 
数据 ， en 因此 ， 我 们 将 把 绘制 调用 需要 引用 
的 资源 ， 通 过 指定 摘 述 符 的 方式 绑 定 到 演 染 流水 线 。 

















为 什么 我 们 要 额外 使 用 描述 符 这 个 中 间 层 呢 ? 究 其 原因 ，GPU 资 源 
实质 都 是 一 些 普 通 的 内 存 块 。 由 于 资源 的 这 种 通用 性 ， 它 们 便 能 被 设置 
到 泻 染 流 水 线 的 不 同 阶段 供 其 使 用 。 一 个 常见 的 例子 是 先 把 纹理 用 作 演 
染 目标 《〈 即 Direct3D 的 绘制 到 纹理 技术 ) ， 随 后 再 将 该 纹理 作为 一 个 着 
色 器 资源 ( 即 此 纹理 会 经 采样 全 而 用 作 着 色 器 的 输入 数据 ) 。 不 管 是 充 





当 泻 染 目标 、 深 度 / 模 板 缓冲 区 还 是 着 色 器 资源 等 角色 ， 仅 靠 资 源 本 号 
是 无 法 体现 出 来 的 。 而 且 ， 我 们 有 时 也 许 只 希望 将 资源 中 的 部 分 数据 绑 
定 至 泻 染 流水 线 ， 但 如 何 从 整个 资源 中 将 它们 选取 出 来 呢 ? 再 者 ， 创 建 
一 个 资源 可 能 用 的 是 无 类 型 格式 ， 这 样 的 话 ，GPU 其 至 不 会 知道 这 个 资 
源 的 具体 格式 。 





解决 上 述 问题 就 是 引入 描述 符 的 原因 。 除 了 指定 资源 数据 ， 描 述 符 
还 会 为 GPU 解释 资源 : 它们 会 告知 Direct3D 某 个 资源 将 如 何 使 用 〈 即 此 
资源 将 被 绑 定 在 流水 线 的 哪个 阶段 上 ) ， 而 且 我 们 可 借助 描述 符 来 指定 
欲 绑 定 资源 中 的 局 部 数据 。 这 就 是 说 ， 如 果 某 个 资源 在 创建 的 时 候 采 用 
了 无 类 型 格式 ， 那 么 我 们 就 必须 在 为 它 创 建 描述 符 时 指明 其 具体 类 型 。 


视图 (view) 与 描述 符 (descriptor〉 是 同义词 。“ 视 图 ” 虽 是 
Direct3D 先 前 版 本 里 的 常用 术语 ， 但 它 仍 然 沿 用 在 Direct3D 12 的 部 分 
API 中 。 在 本 书 里 ， 两 者 交 蔡 使 用 ， 例 如 , “常量 绥 冲 区 视图 (constant 
buffer view) ”与 “常量 绥 冲 区 描述 符 (constant buffer descriptor) ”表达 
的 是 同一 事物 。 











1.CBVSRVWUAV 描 述 符 分 别 表 示 的 是 常量 缓冲 区 视图 (constant 
buffer view) 、 着 色 器 资源 视图 (shader resource view) 和 无 序 访问 视图 


Cunordered access view) 这 3 种 资源 。 


2. 采样 璐 〈sampler， 亦 有 译 为 取样 句 ) 描述 符 表 示 的 是 采样 器 资 
源 《〈 用 于 纹理 贴图 ) 。 





3. RTV 描 述 符 表示 的 是 泻 染 目标 视图 资源 (render target view) 。 





4. DSV 描 述 符 表示 的 是 深度 /模板 视图 资源 (depth/stencil view) 。 


描述 符 堆 〈descriptor heap) 中 存 有 一 系列 描述 符 《〈 可 将 其 看 作 是 
描述 符 数 组 ) ， 本 质 上 是 存放 用 户 程 序 中 某 种 特定 类 型 描述 符 的 一 块 内 
存 。 我 们 需要 为 每 一 种 类 型 的 摘 述 符 都 创建 出 单独 的 描述 符 堆 。 另 外 ， 
也 可 以 为 同一 种 描述 符 类 型 创建 出 多 个 描述 符 堆 。 


我 们 能 用 多 个 描述 符 来 引用 同一 个 资源 。 例 如 ， 可 以 通过 多 个 描述 
符 来 引用 同一 个 资源 中 不 同 的 局 部 数据 。 而 且 ， 前 文 曾 提 到 过 ， 一 种 资 
源 可 以 绑 定 到 演 染 流水 线 的 不 同 阶段 。 因 此 ， 对 于 每 个 阶段 都 需要 设置 
独立 的 描述 符 。 例 如 ， 当 一 个 纹理 需要 被 用 作 演 染 目标 与 着 色 器 资源 
时 ， 我 们 就 要 为 它 分 别 创建 两 个 描述 符 : 一 个 RTV 描述 符 和 一 个 SRV 描 
述 答 。 类 似 地 ， 如 果 以 无 类 型 格式 创建 了 一 个 资源 ， 又 希望 该 纹理 中 的 
元 素 可 以 根据 需求 当 作 浮 点 值 或 整数 值 来 使 用 ， 那 么 就 需要 为 它 分别 创 
建 两 个 描述 符 : 一 个 指定 为 浮 点 格式 ， 力 一 个 指定 为 整数 格式 。 














创建 描述 符 的 最 佳 时 机 为 初始 化 期 间 。 由 于 在 此 过 程 中 需要 执行 一 


些 类 型 的 检测 和 验证 工作 ， 所 以 最 好 不 要 在 运行 时 (runtime) 才 创 建 描 
述 符 。 


注 意 Note 


2009 年 8 月 的 SDK 文 档 写 到 : “所 谓 创建 一 个 完整 类 型 的 资源 ， 即 在 
资源 创建 的 伊始 就 确定 了 它 的 具体 格式 。 这 将 使 运行 时 的 访问 操作 得 到 
优化 [………]。” 因 此 ， 当 确实 需要 用 到 无 类 型 资源 所 带 来 的 灵活 性 时 

( 即 根据 不 同 的 视图 对 同一 种 数据 进行 多 种 不 同 解释 的 能 力 )， 再 以 这 
种 方式 来 创建 资源 ， 人 否则 应 创建 完整 类 型 的 资源 。 








4.1.7 多重 采 样 技术 的 原理 








由 于 屏幕 中 显示 的 像素 不 可 能 是 无 穷 小 的 40， 所 以 并 不 是 任意 一 
条 直线 都 能 在 显示 器 上 “平滑 ?而 完美 地 呈现 出 来 。 图 4.4 所 示 的 ， 即 为 以 
像素 矩阵 (matrix of pixels， 可 以 理解 为 “像素 2D 数 组 ”) 允 近 直线 的 方 
法 所 产生 的 “阶梯 ”(aliasing， 锯 齿 状 走样 ) 效果。 类 似 地 ， 显 示 器 中 呈 
现 的 三 角形 之 边 也 存在 着 不 同 程度 的 锯齿 效应 。 


一 
IT 











图 4.4 ”我 们 能 够 明显 地 看 出 上 面 的 直线 存在 锯齿 效应 《这 种 阶梯 状 的 效果 是 由 以 像素 矩阵 来 表 
示 直 线 所 导致 的 ) 。 下 面 的 反 走 样 直线 ， 则 是 通过 对 每 个 像素 周围 的 像素 进行 采样 ， 并 生成 其 
最 终 的 颜色 而 得 到 的 。 利 用 这 种 方法 能 够 在 一 定 程度 上 绥 解 阶梯 效应 并 得 到 更 加 平滑 的 图 像 





















































通过 提高 显示 器 的 分 辩 率 就 能 够 缩小 像素 的 大 小 EU， 继而 使 上 述 
问题 得 到 显著 地 改善 ， 使 阶梯 效应 在 很 大 程度 上 不 易 被 用 户 所 察觉 








在 不 能 提升 显示 占 分 辨 紊 ， 或 在 显示 占 分 辩 率 受 限 的 情况 下 ， 我 们 
就 可 以 运用 各 种 反 走 样 (antialiasing， 也 有 译作 抗 锯齿 、 反 饮 齿 、 反 失 
真 等 ) 技术 。 有 一 种 名 为 超级 采样 〈supersampling， 可 简 记 作 SSAA， 
即 Super Sample Anti-Aliasing) 的 反 走 样 技术 ， 它 使 用 4 倍 于 屏幕 分 辨 挛 
大 小 的 后 台 绥 冲 区 和 深度 绥 冲 区 。3D 场 景 将 以 这 种 更 大 的 分 辨 率 泻 染 
到 后 台 绥 冲 区 中 。 妆 数据 要 从 后 台 绥 冲 区 调 往 屏 硕 显 示 的 时 候 ， 会 将 后 
台 绥 冲 区 按 4 个 像素 一 组 进行 解析 (resolve， 或 称 降 采 样 ， 
downsample。 把 放大 的 采样 点 数 降低 回 原 采样 点 数 ) : 每 组 用 求 平 均值 
的 方法 得 到 一 种 相对 平滑 的 像素 颜色 。 因 此 ， 超 级 采样 实际 上 是 通过 软 
件 的 方式 提升 了 画面 的 分 辨 率 。 














超级 采样 是 一 种 开销 高 昂 的 操作 ， 因 为 它 将 像素 的 处 理 数 量 和 占用 
的 内 存 大 小 都 增加 到 之 前 的 4 倍 。 对 此 ，Direct3D 还 文 持 一 种 在 性 能 与 
效果 等 方面 都 较为 折 中 的 反 走 样 技术 ， 叫 作 多 重 采 梓 “multisampling， 
可 简 记 作 MSAA， 即 MultiSample Anti-Aliasing) 。 这 种 技术 通过 跨 子 像 
素 H5] 共 享 一 些 计算 信息 ， 从 而 使 它 比 超级 采样 的 开销 更 低 。 现 假设 采 
用 4X 多 重 采 样 〈“ 即 每 个 像素 中 都 有 4 个 子 像 系 ) ， 并 同样 使 用 4 倍 于 屏 
幕 分 辨 率 的 后 台 绥 名 区 和 深度 缓冲 区 。 值 得 注意 的 是 ， 这 种 技术 并 不 需 
要 对 每 一 个 子 像 素 都 进行 计算 ， 而 是 仅 计 算 一 次 像素 中 心 处 的 颜色 ， 再 








基于 可 视 性 《每 个 子 像素 经 深度 /模板 测试 的 结果 ) 和 歼 盖 性 〈 子 像素 
的 中 心 在 多 边 形 的 里 面 还 是 外 面 ? ) 将 得 到 的 颜色 信息 分 享 给 其 子 像 
素 !' 引 。 图 4.5 展 示 了 一 个 多 重 采样 的 相关 实例 。 


(a) {b) 


图 4.5 ”现在 我 们 来 考虑 将 一 个 位 于 多 边 形 边 沿 上 的 像素 进行 多 重 采样 处 理 。 图 a 中 ， 我 们 采集 





该 像素 中 心 的 
绿色 数据 ， 并 将 它 存 于 此 多 边 形 所 覆盖 的 3 个 可 见 子 像 素 中 。 由 于 第 4 个 子 像 素 不 在 该 多 边 形 的 
范围 之 内 ， 
因此 并 不 将 它 更 新 为 绿色 ， 而 是 令 其 继续 保持 之 前 几何 体 绘制 时 所 计算 出 的 颜色 或 是 清除 缓冲 
区 时 所 得 到 的 
颜色 。 图 b 中 ， 为 了 计算 降 采 样 的 像素 颜色 ， 通 过 对 4 个 子 像素 (3 个 绿色 像素 以 及 1 个 白色 像 
素 ) 


求 取 平均 值 的 方式 ， 获 得 多 边 形 边 沿 上 的 一 种 浅 绿色 。 由 于 抗 锯 此 方法 有 效 地 缓解 了 
多 边 形 边沿 处 的 阶梯 效应 ， 因 此 图 像 看 起 来 更 为 平滑 [4] 


超级 采样 和 多 重 采 样 的 关键 区 别 是 显而易见 的 。 对 于 超级 采样 来 
说 ， 图 像 颜色 要 根据 每 一 个 子 像 素来 计算 ， 因 此 每 个 子 像素 都 可 能 各 有 具 
不 同 的 颜色 。 而 以 多 重 采 样 的 方式 〈 见 图 4.5b) 来 求 取 图 像 颜色 时 ， 每 














个 像素 只 需 计算 一 次 ， 最 后 ， 再 将 得 到 的 颜色 数据 复制 到 多 边 形 履 盖 的 
所 有 可 见 子 像素 之 中 。 由 于 计算 图 像 闫 色 是 图 形 流水 线 中 开销 最 大 的 步 
又 之 一 ， 所 以 用 多 重 采 样 来 代 丛 超级 采样 对 节省 资源 而 言 意义 非凡 。 但 
是 话说 回来 ， 超 级 采样 的 精准 度 确实 更 高 一 筹 。 





图 4.5 押 示 的 是 一 种 将 每 个 像素 都 以 均匀 栅 格 划分 为 4 个 子 像素 的 反 
锯齿 采样 模式 。 实 际 上 ， 每 家 人 硬件 广 商 所 采用 的 模式 〈 即 选 定 的 子 像素 
位 置 ， 可 以 说 决定 了 采样 的 位 置 ) 可 能 会 各 不 相同 ， 而 Direct3D 也 并 没 
有 定义 子 像素 的 具体 布局 。 在 各 种 特定 的 情况 下 ， 不 同 的 布局 模式 各 有 
干 秋 。 





4.1.8 利用 Direct3D 进 行 多 重 采 样 


在 接 下 来 的 小 节 中 ， 我 们 要 学 习 填 写 DXGI_SAMPLE_DESC 结 构 体 。 
该 结构 体 中 有 两 个 成 员 ， 其 定义 如 下 : 


typedef struct DXGI_ SAMPLE DESC 
{ 


UINT Count ; 
UINT Quality 
} DXGI_SAMPLE_DESC ; 








Count 成 员 指定 了 每 个 像素 的 采样 次 数 ，Quality 成 员 则 用 于 指示 
用 户 期 望 的 图 像 质 量 级 别 〈“ 对 于 不 同 的 硬件 生产 丙 而 言 , “质量 级 别 ? 的 
意义 可 能 干 兰 万 别 ) 。 采 样 数 量 越 多 或 质量 级 别 越 高 ， 其 泻 染 操作 的 代 














价 也 就 会 愈 发 遍 郧 ， 所 以 希 要 在 质量 与 速度 之 间 做 出 利 鄞 权衡 。 人 至 于 质 
量 级 别 的 范围 ， 则 要 取决 于 纹理 格式 和 每 个 像素 的 采样 数量 。 


根据 给 定 的 纹理 格式 和 采样 数量 ， 我 们 就 能 
用 ID3D12Device: :CheckFeatureSupportl13] 方 法 查询 到 对 应 的 质量 
级 别 [96]; 





typedef struct D3D12 FEATURE DATA MULTISAMPLE QUALITY_ LEVELS { 
DXGI FORMAT Format ; 
UINT SampleCount; 
D3D12 MULTISAMPLE QUALITY_ LEVEL FLAGS Flags; 
UINT NumQualityLevels; 
} D3D12 FEATURE_ DATA MULTISAMPLE QUALITY_ LEVELS; 


D3D12_FEATURE_ DATA MULTISAMPLE QUALITY_LEVELS msQualityLevels; 
msQualityLevels.Format = mBackBufferFormat; 
msQualityLevels.SampleCount = 4; 
msQualityLevels.Flags = D3D12 MULTISAMPLE QUALITY_LEVELS FLAG NONE; 
msQualityLevels.NumQualityLevels = ©; 
ThrowIfFailed(md3dDevice->CheckFeatureSupport( 

D3D12 FEATURE MULTISAMPLE QUALITY LEVELS, 

&msQualityLevels, 

sizeof(msQualityLevels))); 





注意 ， 此 方法 的 第 二 个 参数 兼 具 输 入 和 输出 的 属性 。 当 它 作 为 输入 
参数 时 ， 我 们 必须 指定 纹理 格式 、 采 样 数量 以 及 硕 望 查询 的 多 重 采 样 毛 
支持 的 标志 〔 即 六 flag， 或 作 旗 标 )。 接 着 ， 待 函数 执行 后 便 会 填写 图 
像 质 量 级 别 作 为 输出 。 对 于 某 种 纹理 格式 和 采样 数量 的 组 合 来 讲 ， 其 质 
量 级 别 的 有 效 范 围 为 0 至 NumQualityLevels-1。 





每 个 像素 的 最 大 采样 数量 被 定义 为 : 





但 是 ， 考 虑 到 多 重 采 样 会 占用 内 存 资源 ， 又 为 了 保证 程序 性 能 等 原 
因 ， 通 常会 把 采样 数量 设 定 为 4 或 8。 如 果 不 希 望 使 用 多 重 采 样 ， 则 可 将 
采样 数量 设置 为 1， 并 令 质 量 级 别 为 0。 其 实在 所 有 支持 Direct3D 11 的 设 
备 上 ， 就 已 经 可 以 对 所 有 的 泻 染 目 标 格式 采用 4X 多 重 采 样 了 。 





在 创建 交换 链 绥 冲 区 和 深度 绥 冲 区 时 都 需要 填写 
DXGI_SAMPLE_DESC 结 构 体 。 当 创建 后 台 绥 冲 区 和 深度 绥 冲 区 时 ， 多 重 
采样 的 有 关 设 置 一 定 要 相同 t171。 





4.1.9 ”功能 级 别 


从 Direct3D 11 开 始 便 引进 了 功能 级 别 〈feature level) 的 概念 (在 代 
码 里 用 枚 举 类 型 D3D_FEATURE_LEVEL 表 示 ) ， 以 下 参数 大 致 对 应 于 
Direct3D 9 到 Direct3D 11 之 间 的 各 种 版 本 [8]: 





enum D3D_FEATURE_LEVEL 


D3D_FEATURE LEVEL 9 1 = 6x9166， 
D3D_FEATURE_LEVEL 9 2 = 6x9266， 
D3D_FEATURE_LEVEL 9 3 = 6x93668， 
D3D_FEATURE_LEVEL 16 6 = 6xa68668， 
D3D_FEATURE_LEVEL_ 16 1 = 6xal166， 
D3D_FEATURE LEVEL 11 6 = 6xb666， 
D3D_FEATURE LEVEL 11 1 = 6xb166 


}D3D_FEATURE_LEVEL; 


“功能 级 别 ? 为 不 同 级 别 所 文 持 的 功能 进行 了 严格 的 界定 《每 个 功能 
级 别 所 文 持 的 特定 功能 可 参见 SDK 文 档 ) 。 例 如 ， 一 葡文 持 功能 级 别 11 
的 GPU， 除 了 个 别 特例 之 外 像 类 似 于 多 重 采 样 数量 这 样 的 信息 仍然 需 
要 人 查询， 因为 Direct3D 规 范 人 允许 这 些 Direct3D 11 人 硬件 在 此 方面 有 各 目 不 
同 的 实现 ) ， 必 须 支持 完整 的 Direct3D 11 功 能 集 。 功 能 集 使 程序 员 的 开 
发 工作 更 加 便捷 一 一 只 要 了 解 所 文 持 的 功能 集 ， 就 能 知道 有 哪些 
Direct3D 功 能 可 供 使 用 。 








如 果 用 户 的 硬件 不 支持 某 特 定 功能 级 别 ， 应 用 程序 理 当 回 退 至 版 本 
更 低 的 功能 级 别 。 例 如 ， 为 了 照顾 更 多 用 户 ， 一 款 应 用 程序 可 能 会 文 持 
Direct3D 11、10 旋 至 9.3 级 别 的 硬件。 应 用 程序 当 按 照 从 最 新 到 最 旧 的 
级 别 支持 顺序 展开 检测 : 首先 检测 Direct3D 11 是 否 被 支持 ， 其 次 检测 
Direct3D 10， 最 后 检测 Direct3D 9.3。 在 本 书 中 ， 我 们 总 是 假设 需要 支持 
的 功能 级 别 为 D3D_FEATURE_LEVEL 11 6。 但 是 在 现实 的 应 用 程序 中 ， 
我 们 往往 需要 考虑 支持 稍 旧 的 硬件 ， 以 获得 更 多 的 用 户 。 








4.1.10 DirectX 图 形 基 础 结构 


DirectX 图 形 基础 结构 (DirectX Graphics Infrastructure，DXGI， 也 
有 译作 DirectX 图 形 基础 设施 ) 是 一 种 与 Direct3D 配 合 使 用 的 API。 设 计 
DXGI 的 基本 理念 是 使 多 种 图 形 API 中 所 共有 的 底层 任务 能 借助 一 组 通用 
API 来 进行 处 理 。 例 如 ， 为 了 保证 动画 的 流畅 性 ，2D 演 染 与 3D 泻 染 两 组 
API 都 要 用 到 交换 链 和 页 面 翻转 功能 ， 这 里 所 用 的 交换 链接 口 


IDXGISwapChain《〈 详 见 4.1.4 节 ) 实际 上 就 属于 DXGI API。DXGI 还 用 
于 处 理 一 些 其 他 常用 的 图 形 功能 ， 如 切换 全 屏 模 式 (full-screen mode。 
另 一 种 是 窗口 模式 ，windowed mode) ， 枚 举 显示 适配器 、 显 示 设 备 及 
其 支持 的 显示 模式 〈 分 辨 率 、 刷 新 率 等 ) 等 这 类 图 形 系统 信息 。 除 此 之 
外 ， 它 还 定义 了 Direct3D 文 持 的 各 种 表面 格式 信息 (DXGI_FORMAT) 。 








我 们 刚刚 简单 地 叙述 了 DXGI 的 概念 ， 下 面 来 介绍 一 些 在 Direct3D 
初始 化 时 会 用 到 的 相关 接口 。IDXGIFactory 是 DXGI 中 的 关键 接口 之 
一 ， 主 要 用 于 创建 IDXGISwapChain 接 口 以 及 枚 举 显示 适配器 。 而 显示 
适配器 则 真正 实现 了 图 形 处 理 能 力 。 通 党 来 说 ， 显 示 适 配 右 〈display 
adapter) 是 一 种 硬件 设备 (例如 独立 显卡 ) ， 然 而 系统 也 可 以 用 软件 显 
示 适 配器 来 模拟 硬件 的 图 形 处 理 功 能 。 一 个 系统 中 可 能 会 存在 数 个 适 配 
器 《比如 装 有 数 块 显卡 ) 。 适 配器 用 接口 IDXGIAdapter 来 表示 。 我 们 
可 以 用 下 面 的 代码 来 枚 举 一 个 系统 中 的 所 有 适配器 : 














void D3DApp: :LogAdapters() 
{ 
UINT i = @; 
IDXGIAdapter* adapter = nullptr; 
std: :vector<IDXGIAdapter*> adapterList; 
while(mdxgiFactory->EnumAdapters(i, &adapter) != DXGI_ ERROR_ NOT_FOUND) 
{ 
DXGI_ADAPTER _ DESC desc; 
adapter->GetDesc(&desc); 


std: :wstring text = L"***Adapter: "; 
text += desc.Description; 

text += L"\n"; 
OutputDebugString(text.c_ str()); 


adapterList.push back(adapter); 


++i; 


} 


for(size t i = 6j i < adapterList.size(); ++i) 


LogAdapterOutputs(adapterList[i]); 
ReleaseCom(adapterList[i]); 
} 
} 





运行 上 述 代码 会 输出 类 似 于 下 面 的 信息 : 


***Adapter: NVIDIA GeForce GTX 766 
***Adapter: Microsoft Basic Render Driver 


“Microsoft Basic Render Driver (Microsoft 基 本 呈现 驱动 程序 ) ”是 
Windows 8 及 后 续 系 统 版 本 中 包含 的 软件 适配器 。 





ee 一 个 系统 也 可 能 装 有 数 个 显示 设备 。 我 们 称 每 一 台 显 示 设 备 
都 是 一 个 显示 输出 (display output， 有 的 文档 也 作 adapter output， 适 配 
pap 用 IDXGIOutput 接 口 来 表示 。 每 个 适配器 部 与 一 组 显示 
输出 相关 联 。 举 个 例子 ， 考 虑 这 样 一 个 系统 ， 该 系统 共有 两 块 显卡 和 3 
台 显 示 露 ， 其 中 一 块 显卡 与 两 合 显示 器 相连 ， 第 三 台 显 示 需 则 与 另 一 块 
显卡 相连 。 在 这 种 情况 下 ， 一 块 适 配器 与 两 个 显示 输出 相关 联 ， 而 另 一 
块 则 仅 有 一 个 显示 输出 与 之 关联 。 通 过 以 下 代码 ， 我 们 就 可 以 枚 举 出 与 
某 块 适 配器 关联 的 所 有 显示 和 输出: 




















void D3DApp: :LogAdapterOutputs(IDXGIAdapter*k adapter) 


UINT i = @; 
IDXGIOutput* output = nullptr; 
while(adapter->EnumOutputs(i, &output) != DXGI ERROR NOT_ FOUND) 


DXGI_ OUTPUT_DESC desc; 
output->GetDesc(&desc); 


std: :wstring text = L"***Qutput: "; 
text += desc.DeviceName; 

text += L"\n"; 
OutputDebugString(text.c_ str()); 


LogOutputDisplayModes(output, DXGI_ FORMAT_ B8G8R8A8_UNORM); 


ReleaseCom(output); 


++i; 

















注意 ， 官 方 文档 中 指出 ， 在 系统 显卡 驱动 正常 工作 的 情况 
下 ，“Microsoft Basic Render Driver 不 会 关联 任何 显示 输出 。 


每 种 显示 设备 都 有 一 系列 它 所 支持 的 显示 模式 ， 可 以 用 下 
列 DXGI_MODE_DESC 结 构 体 中 的 数据 成 员 来 加 以 表示 : 





typedef struct DXGI_MODE_DESC 











{ 
UINT Width ; // 分 辩 率 宽度 
UINT Height; // 分 辩 率 高 度 
DXGI_RATIONAL RefreshRate; // 刷新 率 ， 单 位 为 赫兹 Hz 
DXGI_FORMAT Format; // 显示 格式 








DXGI_MODE SCANLINE_ORDER ScanlineOrdering; // 逐 行 扫描 vs .隔行 扫描 
DXGI_MODE_SCALING Scaling; // 图 像 如 何 相 对 于 屏幕 进行 拉 伸 
} DXGI_MODE_DESC; 





























typedef struct DXGI_RATIONAL 
{ 

UINT Numerator; 

UINT Denominator; 
} DXGI_RATIONAL; 


typedef enum DXGI MODE SCANLINE ORDER 
{ 
DXGI_MODE_ SCANLINE _ ORDER _ UNSPECIFIED 
DXGI_MODE SCANLINE ORDER PROGRESSIVE = 1, 
DXGI_MODE SCANLINE ORDER UPPER FIELD FIRST = 2， 
DXGI_MODE SCANLINE ORDER LOWER_ FIELD FIRST = 3 


} DXGI_MODE_SCANLINE_ORDER; [19] 


ll 
© 
= 


typedef enum DXGI_MODE_SCALING 




















{ 
DXGI_MODE_SCALING_UNSPECIFIED = 6， 
DXGI MODE SCALING CENTERED = 1， // 不 做 缩放 ， 将 图 像 显示 在 屏幕 正中 
DXGI MODE SCALING STRETCHED = 2 // 根据 屏幕 的 分 辨 率 对 图 像 进行 拉 伸 
缩放 


} DXGI_MODE_ SCALING; 











一 旦 确定 了 显示 模式 的 具体 格式 (DXGI_FORMAT) ， 我 们 就 能 通 
下 列 代码 ， 获 得 某 个 显示 输出 对 此 格式 所 支持 的 全 部 显示 模式 : 


各 


void D3DApp: :LogOutputDisplayModes(IDXGIOutput* output, DXGI_ FORMAT format 


) 


{ 
UINT count 


UINT flags = ©; 








// 以 nullptr 作 为 参数 调用 此 函数 来 获取 符合 条 件 的 显示 模式 的 个 数 
output->GetDisplayModeList(format, flags, &count, nullptr); 





std: :vector<DXGI MODE DESC> modeList(count); 
output->GetDisplayModelList(format, flags, &count, &modeList[06]); 


for(auto& x : modelList) 
{ 
UINT n X.RefreshRate.Numerator ; 
UINT d = x.RefreshRate.Denominator; 
std: :wstring text = 
L"Width = ”+ std::to wstring(x.Width) + L” "+ 
L"Height = " + std::to wstring(x.Height) + L" "+ 
L"Refresh = " + std::to wstring(n) + L"/" + std::to wstring(d) + 
L"\n"; 


: :OutputDebugString(text.c_ str()); 





运行 以 上 代码 会 输出 下 列 相似 的 结果 : 





***QUtput: \\.\DISPLAY2 


Width = 1926 Height = 1686 Refresh = 59956/1666 


Width = 1926 Height = 1266 Refresh = 59956/1666 

在 进入 全 屏 模 式 之 时 ， 枚 举 显示 模式 就 显得 尤为 重要 。 为 了 获得 最 
优 的 全 屏 性 能 ， 我 们 所 指定 的 显示 模式 〈 包 括 刷 新 率 ) 一 定 要 与 显示 器 
文 持 的 显示 模式 完全 匹配 。 根 据 枚 举 出 来 的 显示 模式 进行 选 定 ， 便 可 以 
保证 这 一 点 。 


有 关 DXGI 的 更 多 资料 ， 可 参阅 “DXGI Overview”(DXGI 概 
述 ) 、“DirectX Graphics Infrastructure: Best Practices“ (DirectX 图 形 基 础 
结构 :最 佳 实践 ) 以 及 “DXGI 1.4 Improvements”(DXGI 1.4 的 改良 ) 等 


这 党， 
4.1.11 功能 支持 的 检测 


我 们 已 经 通过 ID3D12Device: :CheckFeatureSupport 方 法 ， 检 测 
了 当前 图 形 驱 动 对 多 重 采 样 的 支持 。 然 而 ， 这 只 是 此 函数 对 功能 支持 检 
测 的 冰山 一 角 。 这 个 方法 的 原型 为 : 





HRESULT ID3D12Device::CheckFeatureSupport( 
D3D12_FEATURE Feature, 


void *pFeatureSupportData, 
UINT FeatureSupportDataSize); 





1. Feature: 枚 举 类 型 D3D12_FEATURE 中 的 成 员 之 一 ， 用 于 指定 
我 们 希望 检测 的 功能 文 持 类 型 。 


a) D3D12 FEATURE_D3D12_OPTIONS: 检测 当前 图 形 驱 动 对 
Direct3D 12 各 种 功能 的 文 持 情 况 。 








b) D3D12_FEATURE_ARCHITECTURE: 检测 图 形 适 配器 中 GPU 的 硬 
件 体系 架构 特性 。 


c) D3D12 FEATURE_FEATURE_LEVELS: 检测 对 功能 级 别 的 支持 情 
1 元 。 


d) D3D12_FEATURE_FORMAT_SUPPORT: 检测 对 给 定 纹理 格式 的 支 
持 情 况 ( 例 如 ， 指 定 的 格式 能 否 用 于 泻 染 目标 ? 或 ， 指 定 的 格式 能 否 用 
于 混合 技术 ? ) 。 





e) D3D12 FEATURE_MULTISAMPLE_QUALITY_LEVELS: 检测 对 多 
重 采 样 功能 的 支持 情况 。 


2. pFeatureSupportData: 指向 某 种 数据 结构 的 指针 ， 该 结构 中 
存 有 检索 到 的 特定 功能 支持 的 信息 。 此 结构 体 的 具体 类 型 取决 于 
Feature 参 数 。 


a) 如 果 将 Feature 参 数 指定 为 D3D12_FEATURE_D3D12 _OPTIONS， 
则 传 回 的 是 一 个 D3D12_FEATURE_DATA_D3D12_OPTIONS 实 例 。 


b) 如 果 将 Feature 参 数 指定 为 D3D12_FEATURE_ARCHITECTURE， 
则 传 回 的 是 一 个 D3D12_FEATURE_DATA_ARCHITECTURE 实 例 。 


c) 如 果 将 Feature 参 数 指定 
为 D3D12_FEATURE_FEATURE_LEVELS， 则 传 回 的 是 一 
个 D3D12_FEATURE_DATA_FEATURE_LEVELS 实 例 。 


d) 如 果 将 Feature 参 数 指 定 
为 D3D12_FEATURE_FORMAT_SUPPORT， 则 传 回 的 是 一 
个 D3D12_FEATURE_DATA_FORMAT_SUPPORT 实 例 。 


e) 如 果 将 Feature 参 数 指定 
为 D3D12_FEATURE_MULTISAMPLE_QUALITY_LEVELS， 则 传 回 的 是 一 
个 D3D12_FEATURE_DATA_MULTISAMPLE_QUALITY_LEVELS 实 例 。 


3. FeatureSupportDataSize: 传 回 pFeatureSupportData 参 数 
中 的 数据 结构 的 大 小 。 


ID3D12Device: :CheckFeatureSupport 函 数 能 检测 的 支持 功能 
很 多 ， 但 本 书 不 会 对 那些 高 级 的 功能 进行 检测 ， 人 至 于 每 种 功能 结构 体 中 
数据 成 员 的 细节 ， 可 参见 SDK 文 档 。 下 面 举 一 个 例子 ， 里 面 展 示 了 如 何 
对 功能 级 别 〈 详 见 4.1.9 节 ) 的 文 持 情 况 进行 检测 ; 





typedef struct D3D12 FEATURE DATA FEATURE LEVELS { 
UINT NumFeatureLevels; 
const D3D FEATURE LEVEL *pFeatureLevelsRequested; 
D3D_FEATURE_LEVEL MaxSupportedFeatureLevel; 
} D3D12_ FEATURE_ DATA_ FEATURE LEVELS; 


D3D_FEATURE _ LEVEL featureLevels[3] = 





D3D_FEATURE_LEVEL_11 6， // 首先 检测 是 否 文 持 D3D 11 

D3D_FEATURE_LEVEL_16 6， // 其 次 检测 是 否 文 持 D3D 16 

D3D_FEATURE LEVEL 9 3 // 最 后 检测 是 否 文 持 D3D 9.3 
}; 





D3D12_FEATURE DATA FEATURE LEVELS featureLevelsInfo; 
featureLevelsInfo.NumFeatureLevels = 3; 
featureLevelsIinfo.pFeatureLevelsRequested = featureLevels; 
md3dDevice->CheckFeatureSupport( 

D3D12 FEATURE FEATURE_ LEVELS, 


se 
注意 ，CheckFeatureSupport 方法 的 第 二 个 参数 兼 有 输入 和 输出 
的 属性 。 作 为 输入 的 时 候 ， 驳 要 指定 功能 级 别 数 组 中 元 系 的 个 数 
(NumFeatureLevels) ， 再 令 (pFeatureLevelsRequested) 指针 
指 问 功能 级 别 数组 ， 其 中 应 包括 我 们 希望 检测 的 一 系列 硬件 支持 功能 级 
别 。 最 后 ， 此 函数 将 用 MaxSupportedFeatureLevel 字 有 段 返 回 当 前 人 硬件 
可 文 持 的 最 高 功能 级 别 。 


4.1.12 ”资源 驻 留 


复杂 的 游戏 会 运用 大 量 纹理 和 3D 网 格 〈(3d mesh， 详 见 5.2 节 ) 等 资 
源 ， 但 是 其 中 的 大 多 数 并 不 需要 总 是 置 于 显存 中 供 GPU 使 用 。 例 
如 ， 让 我 们 来 构想 这 样 一 个 游戏 场景 : 在 野外 的 和 森林 中 ， 有 一 个 巨大 的 
洞穴 。 在 玩家 进入 洞穴 之 前 ， 绘 制 画 面 并 不 会 用 到 与 洞穴 相关 的 资源 ; 
当 玩 家 进入 洞穴 之 后 ， 又 不 再 需要 森林 数据 资源 。 











在 Direct3D 12 中 ， 应 用 程序 通过 控制 资源 在 显存 中 的 去 留 ， 主 动 管 
理 资 源 的 驻 留 情况 〈 即 residency。 无 论 资源 是 人 否 本 已 位 于 显存 中 ， 都 可 
对 其 进行 管理 。 在 Direct3D 11 中 则 由 系统 自动 管理 ) 。 该 技术 的 基本 思 
路 为 使 应 用 程序 占用 最 小 的 显存 空间 。 这 是 因为 显存 的 空间 有 限 ， 很 可 
能 不 足以 容 下 整个 游戏 的 所 有 资源 ， 或 者 用 户 还 有 运行 中 的 程序 也 在 同 
时 使 用 显存 。 这 里 给 出 一 条 与 性 能 相关 的 提示 : 程序 应 当 避 人 免 在 短 时 间 
内 于 显存 中 交换 进出 相同 的 资源 ， 这 会 引起 过 高 的 开销 。 最 理想 的 情况 

















是 ， 所 清 出 的 资源 在 短 时间 内 不 会 再 次 使 用 。 游 戏 关 卡 或 游戏 场景 的 切 
换 是 关于 第 驻 资 源 的 好 例子 。 


一 般 来 次， 资源 在 创建 时 束 会 驻 留 在 显存 中 ， 而 当 它 被 销毁 时 则 清 
出 。 但 是 通过 下 面 的 方法 ， 我 们 就 可 以 自己 来 控制 资源 的 驻 留 


HRESULT ID3D12Device: :MakeResident( 
UINT NumObjects, 
ID3D12Pageable *const *ppObjects); 


HRESULT ID3D12Device::Evict( 
UINT NumObjects, 
ID3D12Pageable *const *ppObjects); 





这 两 种 方法 的 第 二 个 参数 都 是 ID3D12Pageable 资 源 数 组 ， 第 一 个 
参数 则 表示 该 数组 中 资源 的 数量 。 


为 了 简单 起 见 ， 我 们 会 把 本 书 中 演示 程序 的 规模 控制 得 比 游戏 小 得 
多 ， 所 以 也 就 不 必 对 资源 的 驻 留 进行 管理 。 对 于 资源 驻 留 的 更 多 信息 
参见 《Residency 〈 驻 留 ) 》D0。 


4.2 CPU 与 GPU 间 的 交互 


在 进行 图 形 编程 的 时 候 ， 我 们 一 定 要 了 解 有 两 种 处 理 器 在 参与 处 理 
工作 ， 即 CPU 和 GPU， 两 者 并 行 工作 ， 但 时 而 也 需 同 步 。 为 了 获得 最 佳 
性 能 ， 最 好 的 情况 是 让 两 者 尽量 同时 工作 ， 少 同步 。 同 步 是 一 种 我 们 不 
乐于 执行 的 操作 ， 因 为 这 意味 着 一 种 处 理 器 要 以 空闲 状态 等 符 另 一 种 处 
理 需 完成 菜 些 任务 ， 换 句 话说 ， 它 破坏 了 两 者 并 行 工作 的 机 制 。 











4.2.1 命令 队列 和 命令 列表 


每 个 GPU 都 至 少 维护 着 一 个 命令 队列 (command queue， 本 质 上 是 
环形 缓冲 区 ， 即 ring buffer) 。 借 助 Direct3D API，CPU 可 利用 命令 列表 
(command list) 将 命令 提交 到 这 个 队列 中 去 2 ( 见 图 4.6) 。 当 一 系列 
命令 被 提交 至 命令 队列 之 时 ， 它 们 并 不 会 被 GPU 立 即 执行 ， 理 解 这 一 点 
至 关 重 要 。 由 于 GPU 可 能 正在 处 理 先前 插入 命令 队列 内 的 命令 ， 因 此 ， 
后 来 新 到 的 命令 会 一 直 在 这 个 队列 之 中 等 待 执行 。 


CPU 提交 来 的 命令 





GPU 获取 并 将 处 理 的 
下 一 条 命令 


图 4.6 命令 队列 


假如 命令 队列 中 变 得 空空 如 也 ， 那 么 没有 任务 可 执行 的 GPU 只 能 空 
朵 下 来 ， 相反 地 ， 如 果 命令 队列 被 填 满 ， 那 么 CPU 必 将 随 着 GPU 的 工作 
步伐 在 某 些 时 刻 保持 空闲 [Crawfis12]。 这 两 种 情况 都 是 我 们 不 希望 碰 到 
的 。 对 于 像 游戏 这 样 的 高 性 能 应 用 程序 来 说 ， 它 们 的 目标 是 充分 利用 硬 
件 资源 ， 保 持 CPU 和 GPU 同时 忙碌 。 


在 Direct3D 12 中 ， 命 令 队 列 被 抽象 为 ID3D12CommandQueue 接 口 来 
表示 。 要 通过 填写 D3D12_COMMAND_QUEUE_DESC 结 构 体 来 描述 队列 ， 再 
调用 ID3D12Device: :CreateCommandQueue 方 法 创建 队列 。 我 们 在 本 
书 中 将 实际 采用 以 下 流程 : 

Microsoft: :NRL: :ComPtr<ID3D12CommandQueue> mCommandQueue; 


D3D12 COMMAND QUEUE DESC queueDesc = {}; 
queueDesc.Type = D3D12 COMMAND LIST_ TYPE DIRECT; 


queueDesc.Flags = D3D12 COMMAND QUEUE_ FLAG _ NONE; 
ThrowIfFailed(md3dDevice->CreateCommandQueue( 
&queueDesc, IID PPV_ARGS(&mCommandQueue))); 





IID_PPV_ARGS 辅 助 宏 的 定义 如 下 : 


#define IID PPV_ARGS(ppType) _ uuidof(**(ppType)), IID_ PPV_ARGS Helper(ppT 
ype) 


其 中 ， ”uuidof(**(ppType)) 将 获取 (**(ppType) ) 的 COM 接 口 
ID (globally unique identifier， 全 局 唯一 标识 从 ，GUID〉， 在 上 述 代码 
段 中 得 到 的 即 为 ID3D12CommandQueue 接 口 的 COM ID。IID_PPV_ARGS 
辅助 函数 的 本 质 是 将 ppType 强 制 转换 为 voidx* 类 型 。 我 们 在 全 书 中 都 
会 见 到 此 宏 的 喘 影 ， 这 是 因为 在 调用 Direct3D 12 中 创建 接口 实例 的 API 
时 ， 大 多 都 有 一 个 参数 是 类 型 为 void** 的 待 创 接 口 COM ID。 








ExecuteCommandLists 是 一 种 常用 的 ID3D12CommandQueue 接 口 
方法 ， 利 用 它 可 将 命令 列表 里 的 命令 添加 到 命令 队列 之 中 : 


void ID3D12CommandQueue: :ExecuteCommandLists( 
// 第 二 个 参数 里 命令 列表 数组 中 命令 列表 的 数量 























UINT Count, 
// 待 执行 的 命令 列表 数组 ， 指 向 命令 列表 数组 中 第 一 个 元 素 的 指针 
ID3D12CommandList *const *ppCommandLists); 




















GPU 将 从 数组 里 的 第 一 个 命令 列表 开始 顺序 执行 。 


ID3D12GraphicsCommandListl23 接 口 封装 了 一 系列 图 形 演 染 命 
令 ， 它 实际 上 继承 于 ID3D12CommandList 接 
口 。ID3D12GraphicsCommandList 接 口 有 数 种 方法 向 命令 列表 添加 命 
令 。 例 如 ， 下 面 的 代码 依次 就 向 命令 列表 中 添加 了 设置 视 口 、 清 除 泻 染 
目标 视图 和 发 起 绘制 调用 的 命令 : 








// mCommandList 为 一 个 指向 ID3D12CommandList 接 口 的 指针 
mCommandList->RSSetViewports(1, &mScreenViewport); 


mCommandList->ClearRenderTargetView(mBackBufferView, 
Colors::LightSteelBlue, 868, nullptr); 
mCommandList->DrawIndexedInstanced(36, 1, 60, 60, 0); 





虽然 这 些 方法 的 名 字 看 起 来 像 是 会 使 对 应 的 命令 立即 执行 ， 但 事实 
却 并 非 如 此 ， 上 面 的 代码 仅仅 是 将 命令 加 入 命令 列表 而 已 。 调 
用 ExecuteCommandLists 方 法 才 会 将 命令 真正 地 送 入 命令 队列 ， 供 
GPU 在 合适 的 时 机 处 理 。 随 着 本 书 内 容 的 不 断 深 入 ， 我 们 将 逐步 掌握 
ID3D12GraphicsCommandList 所 文 持 的 各 种 命令 。 当 命令 都 被 加 入 命 
令 列 表 之 后 ， 我 们 必须 调用 ID3D12GraphicsCommandList: :Close 方 
法 来 结束 命令 的 记录 : 


// 结束 记录 命令 
mCommandList->Close(); 
在 调用 ID3D12CommandQueue: :ExecuteCommandLists 方 法 提交 


命令 列表 之 前 ， 一 定 要 将 其 关闭 。 


还 有 一 种 与 命令 列表 有 关 的 名 为 ID3D12CommandAllocator 的 内 存 
管理 类 接口 。 记 录 在 命令 列表 内 的 命令 ， 实 际 上 是 存储 在 与 之 关联 的 命 
令 分 配器 〈command allocator) 上 。 当 通过 
ID3D12CommandQueue: :ExecuteCommandLists 方 法 执行 命令 列表 的 
时 候 ， 命 令 队 列 就 会 引用 分 配器 里 的 命令 。 而 命令 分 配器 则 
由 ID3D12Device 接 口 来 创建 : 





HRESULT ID3D12Device: :CreateCommandA11ocator( 
D3D12_COMMAND_LIST_TYPE type， 


REFIID riid, 
void **ppCommandAllocator); 





1. type: 指定 与 此 命令 分 配器 相关 联 的 命令 列表 类 型 。 以 下 是 本 
书 常 用 的 两 种 命令 列表 类 型 4 。 


a) D3D12_COMMAND_LIST_TYPE_DIRECT。 存 储 的 是 一 系列 可 供 
GPU 直接 执行 的 命令 〈 这 种 类 型 的 命令 列表 我 们 之 前 曾 提 到 过 ) 。 


b) D3D12_COMMAND_LIST_TYPE_BUNDLE。 将 命令 列表 打包 
Cbundle， 也 有 译作 集合 ) 。 构 建 命令 列表 时 会 产生 一 定 的 CPU 开销 ， 
为 此 ，Direct3D 12 提 供 了 一 种 优化 的 方法 ， 人 允许 我 们 将 一 系列 命令 打 成 
所 谓 的 包 。 当 打包 完成 《命令 记录 完毕 ) 之 后 ， 了 驱动 就 会 对 其 中 的 命令 


进行 预 处 理 ， 以 使 它们 在 泻 染 期 间 的 执行 过 程 中 得 到 优化 。 因 此 ， 我 们 
应 当 在 初始 化 期 间 束 用 包 记 录 命 令 。 如 果 经 过 分 析 ， 发 现 构 造 菜 些 命令 
列表 会 花费 大 量 的 时 间 ， 束 可 以 考虑 使 用 打包 技术 对 其 进行 优化 。 
Direct3D 12 中 的 绘制 API 的 效率 很 高 ， 所 以 一 般 不 会 用 到 打包 技术 。 
此 ， 也 许 在 证 明 其 确实 可 以 人 来 性 能 的 显著 提升 时 才 会 用 到 它 。 这 就 是 
说 ， 在 大 多 数 情况 下 ， 我 们 往往 会 将 其 束 之 高 疼 。 本 书 中 不 会 使 用 打包 
技术 ， 关 于 它 的 详情 可 参见 DirectX 12 文 档 P]。 


2. riid: 待 创建 TD3D12CommandAllocator 接 口 的 COM ID。 
3. ppCommandAllocator: 输出 指向 所 建 命令 分 配器 的 指针 。 
命令 列表 同样 由 ID3D12Device 接 口 创建 : 


HRESULT ID3D12Device::CreateCommandList( 
UINT nodeMask， 
D3D12_COMMAND_LIST_TYPE type， 


ID3D12CommandAllocator *pCommandAllocator, 
ID3D12PipelineState *pInitialState, 

REFIID riid, 

void **ppCommandList); 





1. nodeMask: 对 于 仅 有 一 个 GPU 的 系统 而 言 ， 要 将 此 值 设 为 0; 
对 于 具有 多 GPU 的 系统 而 言 ， 此 节点 掩 码 (node mask) 指定 的 是 与 所 
建 命令 列表 相关 联 的 物理 GPU。 本 书 中 假设 我 们 使 用 的 是 单 GPU 系 统 。 


2. type: 命令 列表 的 类 型 ， 常 用 的 选项 
为 D3D12_COMMAND_LIST_TYPE_DIRECT 和 
D3D12_ COMMAND_ LIST_TYPE_BUNDLE. 


3. pCommandAllocator: 与 所 建 命 令 列 表 相 关联 的 命令 分 配器 。 
它 的 类 型 必须 与 所 创 命 令 列表 的 类 型 相 匹 配 。 


4. pInitialstate: 指定 命令 列表 的 泻 染 流水 线 初 始 状态 。 对 于 
打包 技术 来 说 可 将 此 值 设 为 nullptr， 另 外 ， 此 法 同样 适用 于 执行 命令 
列表 中 不 含有 任何 绘制 命令 ， 即 执行 命令 列表 是 为 了 达到 初始 化 的 目的 
的 特殊 情况 。 我 们 将 在 第 6 章 中 详细 讨论 ID3D12PipelineSstate 接 口 。 


5. riid: 待 创建 ID3D12CommandList 接 口 的 COM ID。 


6. ppCommandList: 输出 指 癌 所 建 命令 列表 的 指针 。 


我 们 可 以 通过 ID3D12Device: :GetNodeCount 方 法 来 查询 系统 中 
GPU 适配器 节点 〈 物 理 GPU) 的 数量 。 


我 们 可 以 创建 出 多 个 关联 于 同一 命令 分 配器 的 命令 列表 ， 但 是 不 能 
同时 用 它们 来 记录 命令 。 因 此 ， 当 其 中 的 一 个 命令 列表 在 记录 命令 时 ， 
必须 关闭 同一 命令 分 配器 的 其 他 命令 列表 。 换 句 话 说 ， 要 保证 命令 列表 
中 的 所 有 命令 都 会 按 顺 序 连续 地 添加 到 命令 分 配器 内 。 还 要 注意 的 一 点 
是 ， 当 创建 或 重 置 一 个 命令 列表 的 时 候 ， 它 会 处 于 一 种 “打开 ”的 状态 。 
所 以 ， 当 尝试 为 同一 个 命令 分 配器 连续 创建 两 个 命令 列表 时 ， 我 们 会 得 


D3D12 ERROR: ID3D12CommandList::{Create,Reset}CommandList: The command all 
ocator is currently in-use by another command list. 











(D3D12 错误 : ID3D12CommandList::{Create,Reset}CommandList: 此 命令 分 配器 正在 
被 另 一 个 命令 列表 占用 ) 


























在 调用 ID3D12CommandQueue : :ExecuteCommandList(C) 方法 之 
后 ， 我 们 就 可 以 通过 ID3D12GraphicsCommandList: :Reset 方 法 ， 安 
全 地 复 用 命令 列表 C 占 用 的 相关 底层 内 存 来 记录 新 的 命令 集 。Reset 方 
法 中 的 参数 对 应 于 以 ID3D12Device: :CreateCommandList 方 法 创建 命 
令 列表 时 所 用 的 参数 。 
HRESULT ID3D12GraphicsCommandList::Reset( 


ID3D12CommandAllocator *pAllocator, 
ID3D12PipelineState *pInitialState); 


此 方法 将 命令 列表 恢复 为 刚 创 建 时 的 初始 状态 ， 我 们 可 以 借 此 继续 
复 用 其 低层 内 存 ， 也 可 以 避免 释放 旧 列 表 再 创建 新 列表 这 一 系列 的 烦琐 
操作 。 注 意 ， 重 置 命令 列表 并 不 会 影响 命令 队列 中 的 命令 ， 因 为 相关 的 
命令 分 配器 仍 在 维护 着 其 内 存 中 被 命令 队列 引用 的 系列 命令 。 





问 GPU 提 交 了 一 整 帧 的 泻 染 命令 后 ， 我 们 可 能 还 要 为 了 绘制 下 一 帧 
而 复 用 命令 分 配器 中 的 内 存 。ID3D12CommandAllocator: :Reset 方 法 
由 此 应 运 而 生 : 


HRESULT ID3D12CommandAllocator::Reset(void); 


这 种 方法 的 功能 类 似 于 向 量 类 中 的 std: :vector::clear 方 法 ， 后 
者 使 同 量 的 大 小 (size〉 归 和 零 ， 但 是 仍 保 持 其 当前 的 容量 (capacity) 。 


然而 ， 由 于 命令 队列 可 能 会 引用 命令 分 配器 中 的 数据 ， 所 以 在 没有 确定 
GPU 执行 完 命 令 分 配 回 中 的 所 有 命令 之 前 ， 千 万 不 要 重 置 命令 分 配 
需 ! 下 一 节 将 介绍 相关 内 容 。 


4.2.2 ”CPU 与 GPU 间 的 同步 


当 两 种 处 理 器 并 行 工作 时 ， 目 然而 然 地 就 会 产生 一 系列 的 同步 问 


假设 有 一 资源 R， 里 面 存 有 待 绘制 几何 体 的 位 置信 息 。 现 在 ， 令 
CPU 对 中 的 数据 进行 更 新 ， 先 把 R 中 的 几何 体位 置信 息 改 为 PP， 再 癌 命 
令 队 列 里 添加 绘制 资源 R 的 命令 C， 以 此 将 几何 体 绘制 到 位 置 了 +。 由 于 向 
命令 队列 添加 命令 并 不 会 阻塞 CPU， 所 以 CPU 会 继续 执行 后 序 指令 。 在 
GPU 执行 绘制 命令 C 之 前 ， 如 果 CPU 率 先 覆 写 了 数据 中 ， 提 前 把 其 中 的 
位 置信 息 修 改 为 疡 ， 那 么 这 个 行为 就 会 造成 一 个 严重 的 错误 《〈 见 图 
4.7) 。 


CPU 工作 的 时 间 轴 





GPU 获取 并 处 理 下 一 条 命令 





图 4.7 不 管 是 命令 C 按 坐标 P2 绘 制 几何 体 ， 





还 是 在 绘制 的 过 程 中 更 新 资源 及 都 是 错误 的 
行为 。 这 两 种 情况 都 不 是 我 们 所 预期 的 














We bi 强制 CPU 等 待 ， 直 到 GPU 完成 所 有 命令 
的 处 理 ， 达 到 某 个 指定 的 围栏 点 fence point) 为 止 。 我 们 将 这 种 方法 
et et 可 以 通过 围栏 
(fence) 来 实现 这 一 点 。 围 栏 用 ID3D12Fence 接 口 来 表示 9， 此 技术 
能 用 于 实现 GPU 和 CPU 间 的 同步 。 创 建 一 个 围栏 对 象 的 方法 如 下 : 


HRESULT ID3D12Device: :CreateFence( 
UINT64 InitialValue， 
D3D12 FENCE_FLAGS Flags, 
REFIID riid, 
void **ppFence); 


// 不 例 
ThrowIfFailed(md3dDevice->CreateFence( 
9， 
D3D12_FENCE FLAG NONE, 
IID_PPV_ARGS(&mFence) ) ) ; 





每 个 围栏 对 象 都 维护 着 一 个 UINT64 类 型 的 值 ， 此 为 用 来 标识 围栏 
点 的 整数 。 起 初 ， 我 们 将 此 值 设 为 0， 每 当 需 要 标记 一 个 新 的 围栏 点 时 
就 将 它 加 1。 现 在 ,我 们 用 代码 和 注释 进行 展示 ， 看 看 如 何 用 一 个 围栏 
来 刷新 命令 队列 。 





UINT64 mCurrentFence = 0) 
void D3DApp: :FlushCommandQueue() 














// 增加 围栏 值 ， 接 下 来 将 命令 标记 到 此 围栏 点 


mCurrentFencett+; 

















// 向 命令 队列 中 添加 一 条 用 来 设置 新 围栏 点 的 命令 

// 由 于 这 条 命令 要 交 由 GPU 处 理 ( 即 由 GPU 端 来 修改 围栏 值 ) ， 所 以 在 GPU 处 理 完 命令 队列 
中 此 Signal() 

// 以 前 的 所 有 命令 之 前 ， 它 并 不 会 设置 新 的 围栏 点 [27] 





















































ThrowIfFailed(mCommandQueue->Signal(mFence.Get(), mCurrentFence)); 








// 在 CPU 端 等 待 GPU， 直 到 后 者 执行 完 这 个 围栏 点 之 前 的 所 有 命令 
if(mFence->GetCompletedValue() < mCurrentFence) 
{ 
HANDLE eventHandle = CreateEventEx(nullptr, false, false, EVENT ALL AC 
CESS); 








// 若 GPU 命 中 当前 的 围栏 ( 即 执行 到 signal( ) 指 令 ， 修 改 了 围栏 值 )， 则 激发 预定 事 





件 
ThrowIfFailed(mFence->SetEventOnCompletion(mCurrentFence, eventHandle) 


); 


// 等 待 GPU 命 中 国 栏 ， 激 发 事件 
WaitForSingleObject(eventHandle, INFINITE); 
CloseHandle(eventHandle); 








图 4.8 为 这 段 代 码 的 时 间 轴 示意 图 。 


这 样 一 来 ， 在 本 市 开始 给 出 的 情景 中 ， 当 CPU 友 出 绘制 命令 C 后 ， 
在 将 R 内 的 位 置信 息 改 写 为 之前， 应 率先 刷新 命令 队列 。 这 种 解决 方 
案 其 实 并 不 完美 ， 因 为 这 意味 着 在 等 每 GPU 处 理 命令 的 时 候 ，CPU 会 处 
于 空 采 状态 ， 但 在 第 7 章 以 前 也 只 能 暂时 使 用 这 个 简单 的 办 法 了 。 我 们 
几乎 可 以 在 任何 时 间 扣 上 刷新 命令 队列 当然， 不 一 定 仅 在 泻 染 每 一 帧 
时 才 刷 新 一 次 ) 。 例 如 ， 若 有 一 些 GPU 初始 化 命令 有 待 执行 ， 我 们 便 可 
以 在 进入 演 染 主 循环 之 前 刷新 命令 队列 ， 从 而 进行 这 些 初 始 化 操作 。 











围栏 n 围栏 n+1 


GPU 时 间 线 





“Signal(fence, 1) 


CPU 时 间 线 ~ wm 
Xcpu 


图 4.8 GPU 已 经 执行 到 了 命令 Z9pu， 而 CPU 则 刚刚 在 :icpu 处 调用 了 














ID3D12CommandQueue: :Signal(fence，n+1) 方 法 让 GPU 端 设置 围栏 值 。 该 方法 实际 上 是 在 
命令 队列 的 结尾 处 添加 一 条 命令 ， 使 围栏 值 变 为 Ri 十 7 的 初始 值 为 0) 。 而 在 GPU 处 理 完 命令 
队列 中 Signal(fence，n+1) 之 前 的 所 有 命令 以 前 ，CPU 端 调用 的 mFence- 
>GetCompletedValue() 方 法 会 一 直 返 回 值 n 



































其 实 ， 用 刷新 命令 队列 的 办 法 也 可 以 解决 上 一 小 节 末 尾 过 到 的 问 
题 ， 即 在 重 置 命令 分 配器 之 前 ， 先 刷新 命令 队列 来 确定 GPU 的 命令 都 已 
执行 完毕 。 


4.2.3 ”资源 转换 


为 了 实现 常见 的 泻 染 效果 ， 我 们 经 常会 通过 GPU 对 某 个 资源 R 按 顺 
序 进行 先 写 后 读 这 两 种 操作 。 然 而 ， 当 GPU 的 写 操 作 还 没有 完成 抑或 其 
至 还 没有 开始 ， 却 开始 读 取 资 源 ， 便 会 导致 资源 冒险 〈resource 
hazard) 。 为 此 ，Direct3D 专 门 针对 资源 设计 了 一 组 相关 状态 。 资 源 在 
创建 伊始 会 处 于 默认 状态 ， 该 状态 将 一 直 持续 到 应 用 程序 通过 Direct3D 
将 其 转换 (transition〉 为 另 一 种 状态 为 止 。 这 就 使 GPU 能 够 针对 资源 状 
态 转 换 与 防止 资源 冒险 作出 适当 的 行为 。 例 如 ， 如 果 要 对 某 个 资源 〈 比 
如 纹理 ) 执行 写 操作 时 ， 需 要 将 它 的 状态 转换 为 泻 染 目标 状态 ， 而 要 对 
该 纹理 进行 读 操作 时 ， 再 把 它 的 状态 变 为 着 色 器 资源 状态 。 根 据 
Direct3D 给 出 的 转换 信息 ，GPU 就 可 以 采取 适当 的 措施 避免 资源 冒险 的 
发 生 。 辟 如， 在 读 取 茶 个 资源 之 前 ， 它 会 等 待 所 有 与 之 相关 的 号 操作 执 
行 完 毕 。 应 用 程序 开发 者 应 当知 道 ， 资 源 转换 所 市 来 的 负 葵 会 造成 程序 
性 能 的 下 降 。 除 此 之 外 ， 一 个 自动 跟踪 状态 转换 的 系统 也 在 强行 增加 程 
序 的 额外 开销 P9]。 











过 命令 列表 设置 转换 资源 屏障 (transition resource barrier ) 数 
组 ， 资源 的 转换 ; a i 源 
的 时 候 ， 这 种 数组 就 派 上 了 用 场 。 在 代码 中 ， 屏障 
a i 数 《定义 
于 d3dx12.h 头 文件 之 中 ) 将 根据 用 户 给 出 的 资源 和 指定 的 前 后 转换 状 
态 ， 返 回 对 应 的 转换 资源 屏障 描述 : 





struct CD3DX12 RESOURCE BARRIER : public D3D12 RESOURCE BARRIER 
/ [...] 辅助 方法 


static inline CD3DX12 RESOURCE BARRIER Transition( 
_In_ ID3D1i2Resource* pResource, 
D3D12_RESOURCE_STATES stateBefore, 
D3D12_ RESOURCE_STATES stateAfter， 
UINT subresource = D3D12 RESOURCE BARRIER ALL SUBRESOURCES, 
D3D12 RESOURCE_ BARRIER FLAGS flags = D3D12 RESOURCE BARRIER FLAG NONE) 


CD3DX12 RESOURCE BARRIER result; 

ZeroMemory(&result, sizeof(result)); 

D3D12 RESOURCE BARRIER &barrier = result; 

result.Type = D3D12 RESOURCE BARRIER_ TYPE_ TRANSITION; 
result.Flags = flags; 

barrier.Transition.pResource = pResource; 
barrier.Transition.StateBefore = stateBefore; 
barrier.Transition.StateAfter = stateAfter; 
barrier.Transition.Subresource = subresource; 

return result; 











/ [...] 其 他 辅助 方法 














}; 


可 以 看 到 ，CD3DX12_RESOURCE_BARRIER 继 承 自 
D3D12_RESOURCE_BARRIER 结 构 体 ， 并 添加 了 一 些 辅助 方法 。Direct3D 
12 中 的 许多 结构 体 都 有 其 对 应 的 扩展 辅助 结构 变 体 〈variation) ， 考 虑 

到 使 用 上 的 方便 性 ， 我 们 更 偏爱 于 运用 那些 变 体 。 以 CD3DX12 作 为 前 级 





的 变 体 全 都 定义 在 d3dx12.h 头 文件 当中 ， 这 个 文件 并 不 属于 DirectX 12 
SDK 的 核心 部 分 ， 但 是 可 以 通过 微软 的 官方 网 站 下 载 获 得 。 为 了 方便 起 
见 ， 本 书 源 代码 的 Common 目 录 里 附 有 一 份 d3dx12.h 头 文件 。 








在 本 章 的 示例 程序 中 ， 此 辅助 函数 的 用 法 如 下 : 


mCommandList->ResourceBarrier(1， 
&CD3DX12 RESOURCE BARRIER: :Transition( 
CurrentBackBuffer(), 


D3D12_RESOURCE_STATE_PRESENT, 
D3D12_ RESOURCE_ STATE_ RENDER TARGET)); 








这 段 代 码 将 以 图 片 形 式 显 示 在 屏 知 中 的 纹理 ， 从 呈现 状态 转换 为 泻 
染 目 标 状态 。 那 么 ， 这 个 添加 到 命令 列表 中 的 资源 屏障 究竟 是 何 物 呢 ? 
事实 上 ， 我 们 可 以 将 此 资源 屏 隐 转换 看 作 是 一 条 告知 GPU 有 某 资 源 状 态 正 
在 进行 转换 的 命令 。 所 以 在 执行 后 续 的 命令 时 ，GPU 便 会 采取 必要 措施 
以 防 资源 冒险 。 





Direct3D 12 提 供 的 转换 类 型 不 止 文中 提 到 窒 窗 儿 种 。 但 是 ， 我 们 暂 
时 只 会 用 到 上 述 转换 屏障 。 至 于 其 他 类 型 的 屏障 ， 我 们 将 随 用 随 讲 。 


4.2.4 ”命令 与 多 线程 


Direct3D 12 的 设计 目标 是 为 用 户 提供 一 个 高 效 的 多 线程 环境 ， 命 令 
列表 也 是 一 种 发 挥 Direct3D 多 线程 优势 的 途径。 对 于 内 含 许多 物体 的 庞 
大 场景 而 言 ， 仅 通过 一 个 构建 命令 列表 来 绘制 整个 场景 会 占用 不 少 的 
CPU 时 间 。 因 此 ， 可 以 采取 一 种 并 行 创建 命令 列表 的 思路 。 例 如 ， 我 们 
可 以 创建 4 条 线程 ， 每 条 分 别 负责 构建 一 个 命令 列表 来 绘制 25% 的 场景 
物体 。 








以 下 是 一 些 在 多 线程 环境 中 使 用 命令 列表 要 注意 的 问题 。 


1. 命令 列表 并 非 自 由 线程 (not free-threaded) 对 象 。 也 就 是 说 ， 
多 线程 既 不 能 同时 共享 相同 的 命令 列表 ， 也 不 能 同时 调用 同一 命令 列表 
的 方法 。 所 以 ， 每 个 线程 通 各 都 只 使 用 各 目的 命令 列表 。 








2. 命令 分 配 右 亦 不 是 线程 自由 的 对 象 。 这 就 是 说 ， 多 线程 既 不 能 
同时 共 至 同一 个 命令 分 配器 ， 也 不 能 同时 调用 同一 命令 分 配 占 的 方法 。 
所 以 ， 每 个 线程 一 般 都 仅 使 用 属于 目 己 的 命令 分 配 需 。 

3. 命令 队列 是 线程 目 由 对 象 ， 所 以 多 线程 可 以 同时 访问 同一 命令 
队列 ， 也 能 够 同时 调用 它 的 方法 。 特 别 是 每 个 线程 都 能 同时 间 命 令 队列 
提交 它们 上 自己 所 生成 的 命令 列表 。 

4. 出 于 性 能 的 原因 ， 应 用 程序 必须 在 初始 化 期 间 ， 指 出 用 于 并 行 
记录 命令 的 命令 列表 最 大 数量 。 


为 了 简单 起 见 ， 本 书 不 会 使 用 多 线程 技术 。 完 成 本 书 的 阅读 后 ， 读 
者 可 以 通过 查阅 SDK 中 的 Multithreading12 示 例 C20 来 学 习 怎 样 并 行 生 成 


命令 列表 。 如 果 和 希望 应 用 程序 充分 利用 系统 资源 ， 应 该 通过 多 线程 技术 
来 发 挥 CPU 多 核心 的 并 行 处 理 能 


4.3 初始 化 Direct3D 


这 一 节 我 们 会 利用 目 己 编写 的 演示 框架 来 展示 Direct3D 的 初始 化 过 
程 。 这 是 一 个 比较 见长 的 流程 ， 但 每 个 程序 只 需 执行 一 次 即 可 。 我 们 对 
Direct3D 进 行 初 始 化 的 过 程 可 以 分 为 以 下 几 个 步 又 : 





1. 用 D3D12CreateDevice 函 数 创建 1D3D12Device 接 口 实例 。 
2. 创建 一 个 ID3D12Fence 对 象 ， 并 查询 描述 符 的 大 小 。 

3. 检测 用 户 设备 对 4X MSAA 质 量 级 别 的 支持 情况 。 

4. 依次 创建 命令 队列 、 命 令 列表 分 配器 和 主 命令 列表 。 

5. 描述 并 创建 交换 链 。 

6. 创建 应 用 程序 所 需 的 描述 符 堆 。 

7. 调整 后 台 绥 冲 区 的 大 小 ， 并 为 它 创 建 演 染 目标 视图 。 

8. 创建 深度 /模板 缓冲 区 及 与 之 关联 的 深度 /模板 视图 。 


9. 设置 视 口 (viewport) 和 裁剪 矩形 〈scissor rectangle) 。 


4.3.1 创建 设备 


要 初始 化 Direct3D， 必 须 先 创建 Direct3D 12 设 备 





(ID3D12Device) 。 此 设备 代表 着 一 个 显示 适 配 占 。 一 般 来 说 ， 显 示 
适配器 是 一 种 3D 图 形 便 件 〈 如 显卡 ) 。 但 是 ， 一 个 系统 也 能 用 软件 显 
示 适 配器 来 模拟 3D 图 形 硬 件 的 功能 (如 WARP 适 配器 〉。Direct3D 12 设 
备 既 可 检测 系统 环境 对 功能 的 支持 情况 ， 又 能 创建 所 有 其 他 的 Direct3D 
接口 对 象 ( 如 资源 、 视 图 和 命令 列表 ) 。 通 过 下 面 的 函数 就 可 以 创建 
Direct3D 12 设 备 : 





HRESULT WINAPI D3D12CreateDevicel( 
IUnknown* pAdapter, 


D3D_FEATURE LEVEL MinimumFeatureLevel, 
REFIID riid, // ID3D12Device 的 COM ID 
void** ppDevice ); 








1. pAdapter: 指定 在 创建 设备 时 所 用 的 显示 适配器 。 知 将 此 参数 
设 定 为 空 指针 ， 则 使 用 主 显示 适配器 。 我 们 在 本 书 的 示例 中 总 是 采用 主 
适配器 。 在 4.1.10 节 中 ， 我 们 已 展示 了 怎样 枚 举 系统 中 所 有 的 显示 适 配 
2 


2. MinimumFeatureLevel: 应 用 程序 需要 硬件 所 文 持 的 最 低 功 能 
级 别 。 如 果 适 配器 不 支持 此 功能 级 别 ， 则 设备 创建 失败 。 在 我 们 的 框架 
中 指定 的 是 D3D_FEATURE_LEVEL_11 8 ( 即 支持 Direct3D 11 的 特性 ) 。 


3. riid: 所 建 ID3D12Device 接 口 的 COM ID。 
4. ppDevice: 返回 所 创建 的 Direct3D 12 设 备 。 


以 下 是 此 函数 的 调用 示例 : 


#if defined(DEBUG) || defined(_ DEBUG) 





// 启用 D3D12 的 调试 层 





CompPtr<ID3D12Debug> debugController; 
ThrowIfFailed(D3D12GetDebugInterface(IID PPV_ARGS(&debugController))); 
debugController->EnableDebugLayer(); 


} 
#endif 


ThrowIfFailed(CreateDXGIFactory1(IID PPV_ARGS(&mdxgiFactory))); 














// 尝试 创建 硬件 设备 

HRESULT hardwareResult = D3D12CreateDevice( 
nullptr, // 默认 适配器 
D3D_FEATURE_LEVEL 11 6， 
IID_PPV_ARGS(&md3dDevice)); 





// 回 退 至 WARP 设 备 
if(FAILED(hardwareResult)) 
{ 
Comptr<IDXGIAdapter> pWarpAdapter; 
ThrowIfFailed(mdxgiFactory->EnumWarpAdapter(IID PPV_ARGS(&pWarpAdapter)) 
); 


ThrowIfFailed(D3D12CreateDevice( 
pWarpAdapter .Get()， 
D3D_FEATURE LEVEL 11 6， 
IID_PPV_ARGS(&md3dDevice) ) ) ; 





可 以 看 到 ， 为 了 进入 调试 模式 ， 我 们 首先 开启 了 调试 层 (debug 
layer) 。 随 后 ，Direct3D 便 会 开局 额外 的 调试 功能 ， 并 在 错误 发 生 时 问 
VC++ 的 输出 窗口 发 送 类 似 于 下 面 的 调试 信息 : 


D3D12 ERROR: ID3D12CommandList::Reset: Reset fails because the command lis 


t was not closed. 
(D3D12 ERROR: ID3D12CommandList::Reset: 由 于 没有 关闭 命令 列表 因此 重 置 失 败 。) 











还 可 以 发 现 ， 当 调用 D3D12CreateDevice 失 败 后 ， 程 序 将 回 退 到 
一 种 软件 适配器 : WARP 设 备 。WARP 意 为 Windows Advanced 
Rasterization Platform (Windows 高 级 光栅 化 平台 ) 。 在 Windows 7 及 以 


下 版 本 的 操作 系统 中 ，WARP 设 备 文 持 的 最 高 功能 级 别 是 10.1; 在 
Windows 8 系统 中 ，WARP 设 备 支 持 的 最 高 功能 级 别 是 11.18341。 为 了 创 
建 WARP 适 配器 ， 需 要 先 创建 一 个 IDXGIFactory4 对 象 ， 并 通过 它 来 枚 
举 WARP 适 配器 : 


Comptr<IDXGIFactory4> mdxgiFactory; 
CreateDXGIFactory1(IID PPV_ARGS(&mdxgiFactory)); 


mdxgiFactory->EnumWarpAdapter( 
IID_PPV_ARGS(&pWarpAdapter)); 





作为 DXGI 的 一 部 分 ，mdxgiFactory 对 象 也 可 用 于 创建 交换 链 。 
4.3.2 ”创建 围栏 并 获取 描述 符 的 大 小 


一 且 创 建 好 设备 ， 便 可 以 为 CPU/GPU 的 同步 而 创建 围栏 了 。 另 
外 ， 若 用 描述 符 进 行 工 作 ， 还 需要 了 解 它们 的 大 小 。 但 描述 符 在 不 同 的 
GPU 平台 上 大 小 各 异 ， 这 就 需要 我 们 去 查询 相关 的 信息 。 随 后 ， 我 们 会 
把 描述 符 的 大 小 缓存 起 来 ， 需 要 时 即 可 直接 引用 : 





ThrowIfFailed(md3dDevice->CreateFence( 
6，D3D12 FENCE FLAG NONE, IID PPV_ARGS(&mFence))); 
mRtvDescriptorSize = md3dDevice->GetDescriptorHandleIncrementSize( 
D3D12_DESCRIPTOR HEAP_TYPE_RTV); 


mDsvDescriptorSize = md3dDevice->GetDescriptorHandleIncrementSize( 
D3D12_DESCRIPTOR HEAP_TYPE_DSV); 

mCbvUavDescriptorSize = md3dDevice->GetDescriptorHandleIncrementSize( 
D3D12_ DESCRIPTOR HEAP_TYPE_CBV_SRV_UAV); 





4.3.3 检测 对 4X MSAA 质 量 级别 的 支持 


在 本 书 中 ， 我 们 要 对 4X MSAA 的 支 持 情况 进行 检测 。 这 里 选择 
4X， 是 因为 借 此 采样 数量 就 可 以 获得 开销 不 高 却 性 能 不 凡 的 效果 。 而 
且 ， 在 一 切 支 持 Direct3D 11 的 设备 上 ， 所 有 的 演 染 目标 格式 就 缘 已 文 持 
4XMSAA 了 。 因 此 ， 凡 是 支持 Direct3D 11 的 硬件 ， 都 会 保证 此 项 功能 
的 正常 开启 ， 我 们 也 就 无 须 再 对 此 进行 检验 了 。 但 是 ， 对 质量 级 别 的 检 
测 还 是 不 可 或 缺 ， 为 此 ， 可 采取 下 列 方法 加 以 实现 : 








D3D12_FEATURE_DATA_MULTISAMPLE_QUALITY_LEVELS msQualityLevels; 
msQualityLevels.Format = mBackBufferFormat; 
msQualityLevels.SampleCount = 4; 
msQualityLevels.Flags = D3D12 MULTISAMPLE QUALITY_ LEVELS FLAG _ NONE; 
msQualityLevels.NumQualityLevels = ©; 
ThrowIfFailed(md3dDevice->CheckFeatureSupport( 

D3D12_FEATURE_MULTISAMPLE_QUALITY_LEVELS， 

&msQualityLevels, 

sizeof (msQualityLevels))); 


m4xMsaaQuality = msQualityLevels.NumQualityLevels; 
assert(m4xMsaaQuality > 6 && "Unexpected MSAA quality level."); 





由 于 我 们 所 用 的 平台 必 能 支持 4X MSAA 这 一 功能 ， 其 返回 值 应 该 
也 总 是 大 于 0， 所 以 对 此 而 做 出 上 述 断 言 。 


4.3.4 创建 命令 队列 和 命令 列表 


回顾 4.2.1 节 可 知 : ID3D12CommandQueue 接 口 表 示 命 令 队 
列 ，ID3D12CommandAllocator 接 口 代表 命令 分 配 
器 ，ID3D12GraphicsCommandList 接 口 表示 命令 列表 。 据 此 ， 我 们 通 
过 以 下 代码 分 别 展 示 这 几 种 对 象 的 创建 流程 : 


ComPtr<ID3D12CommandQueue> mCommandQueue; 





Comptr<ID3D12CommandAllocator> mDirectCmdListAlloc; 
Comptr<ID3D12GraphicsCommandList> mCommandList; 
void D3DApp: :CreateCommandObjects() 


D3D12 COMMAND QUEUE DESC queueDesc = {}; 

queueDesc.Type = D3D12 COMMAND LIST TYPE_ DIRECT; 

queueDesc.Flags = D3D12 COMMAND QUEUE_ FLAG NONE; 

ThrowIfFailed(md3dDevice->CreateCommandQueue( 
&queueDesc, IID PPV_ARGS(&mCommandQueue))); 

ThrowIfFailed(md3dDevice->CreateCommandAllocator( 
D3D12 COMMAND LIST_TYPE_DIRECT, 


IID PPV_ARGS(mDirectCmdListAlloc.GetAddressOf()))); 


ThrowIfFailed(md3dDevice->CreateCommandList( 

6， 

D3D12 COMMAND LIST_TYPE_DIRECT ， 
mDirectCmdListAlloc.Get()，// 关联 命令 分 配器 

nullptr, // 初始 化 流水 线 状 态 对 象 
IID_PPV_ARGS(mCommandList.GetAddressof()))); 





// 首先 要 将 命令 列表 置 于 关闭 状态 。 这 是 因为 在 第 一 次 引用 命令 列表 时 ， 我 们 要 对 它 进行 
E 置 ， 而 在 调用 











jm 














// 重 置 方法 之 前 又 需 先 将 其 关闭 
mCommandList->Close(); 


} 





观察 CreateCommandList 方 法 会 及 现 ， 我 们 将 流水 线 状态 对 象 
(pipeline state object〉 这 一 参数 指定 为 了 空 指针 。 在 本 章 的 示例 程序 
中 ， 由 于 我 们 不 会 发 起 任何 绘制 命令 ， 所 以 也 就 不 会 用 到 流水 线 状 态 对 
象 。 在 第 6 章 中 ， 我 们 会 对 流水 线 状 态 对 象 开展 更 为 详细 的 讨论 。 





4.3.5 ”描述 并 创建 交换 链 


初始 化 流程 的 下 一 步 是 创建 交换 链 。 首 先 ， 要 填 
DXGI_SWAP_CHAIN_DESC 结 构 体 实 例 ， 用 它 来 描述 欲 创建 交换 链 的 特 
性 。 此 结构 体 的 定义 如 下 : 


填写 一 份 
/7 


typedef struct DXGI_SWAP_CHAIN_DESC 
{ 
DXGI MODE _ DESC BufferDesc; 
DXGI_ SAMPLE DESC SampleDesc; 
DXGI_USAGE BufferUsage; 
UINT BufferCount ; 


HWND OutputWindow; 

BOOL Windowed; 
DXGI_SWAP_EFFECT SwapEffect; 
UINT Flags; 
DXGI_SWAP_CHAIN_DESC; 








其 中 的 DXGI_MODE_DESC 类 型 则 是 男 一 种 结构 体 ， 它 的 定义 为 : 


typedef struct DXGI MODE_DESC 





UINT Width; // 组 六 
UINT Height; // 缓冲 区 
DXGI_RATIONAL RefreshRate; 


和 # 率 的 宽度 
# 率 的 高 度 








区 分 辨 
分 辨 








DXGI_FORMAT Format; // 缓冲 区 的 显示 格式 
DXGI_MODE_SCANLINE_ORDER ScanlineOrdering; // 逐 行 扫描 vs。 隔行 扫描 
DXGI_MODE SCALING Scaling; // 图 像 如 何 相 对 于 屏幕 进行 拉 
伸 
} DXGI MODE DESC; 








在 下 列 数据 成 员 的 描述 中 ， 只 涉及 对 于 初学 者 来 讲 最 为 重要 的 常用 
标志 和 选项 。 人 至 于 其 他 标志 和 选项 的 描述 ， 可 参见 SDK 的 相关 文档 。 


1. BufferDesc: 这 个 结构 体 描述 了 待 创建 后 台 缓 冲 区 的 属性 。 在 
这 里 我 们 仅 关 注 它 的 宽度 、 高 度 和 像素 格式 属性 。 至 于 其 他 成 员 的 细节 
可 查看 SDK 文 档 。 


2. SampleDesc: 多 重 采 样 的 质量 级 别 以 及 对 每 个 像素 的 采样 次 
数 ， 可 参见 4.1.8 节 。 对 于 单 次 采样 来 说 ， 我 们 要 将 采样 数量 指定 为 1， 
质量 级 别 指定 为 0。 


3. BufferUsage: 由 于 我 们 要 将 数据 泻 染 至 后 台 绥 冲 区 《〈 即 用 它 
作为 泻 染 目标 ) ， 因 此 将 此 参数 指定 
为 DXGI_USAGE_RENDER_TARGET_OUTPUT。 


4. BufferCount: 交换 链 中 所 用 的 缓冲 区 数量 。 我 们 将 它 指定 为 
2， 即 采用 双 绥 冲 。 





5. OutputWindow: 演 染 窗口 的 句柄 。 


6. Nindowed: 若 指 定 为 true， 程 序 将 在 窗口 模式 下 运行 ， 如 果 指 
定 为 false， 则 采用 全 屏 模式 。 


7. SwapEffect: 指定 为 DXGI_SWAP_EFFECT_FLIP_DISCARD。 


8. Flags: 可 选 标 志 。 如 果 将 其 指定 
为 DXGI_SWAP_CHAIN_FLAG ALLOW_MODE_SWITCH， 那 么 ， 当 程序 切换 
为 全 屏 模 式 时 ， 它 将 选择 最 适 于 当前 应 用 程序 窗口 尺寸 的 显示 模式 。 如 
果 没 有 指定 该 标志 ， 妆 程序 切换 为 全 屏 模式 时 ， 将 采用 当前 架 面 的 显示 
模式 。 








描述 完 交 换 链 之 后 ， 我 们 用 IDXGIFactory: :CreateSwapChain 方 
法 来 创建 它 : 


HRESULT IDXGIFactory::CreateSwapChain( 
IUnknown *pDevice, // 指向 ID3D12CommandQueue 接 口 的 指针 














DXGI_SWAP_CHAIN_DESC *pDesc, // 指向 描述 交换 链 的 结构 体 的 指针 
IDXGISwapChain **ppSwapChain); // 返回 所 创建 的 交换 链接 口 























下 面 的 代码 展示 了 如 何 通 过 本 书 的 演示 框架 来 方便 地 创建 交换 链 。 
研究 此 函数 的 代码 就 会 发 现 ， 我 们 是 按照 可 以 对 它 进 行 多 次 调用 来 设计 
的 。 即 ， 在 创建 新 的 交换 链 之 前 ， 驳 要 销毁 旧 的 交换 链 。 这 样 一 来 ， 我 
们 就 可 以 用 不 同 的 设置 来 重新 创建 交换 链 ， 借 此 在 运行 时 修改 多 重 采 样 
的 配置 355。 


DXGI_FORMAT mBackBufferFormat = DXGI_FORMAT_R8G8B8A8_UNORM; 


void D3DApp: :CreateSwapChain() 

{ 
// 释放 之 前 所 创 的 交换 链 ， 随 后 再 进行 重建 
mSwapChain.Reset(); 




















DXGI_SWAP_CHAIN DESC sd; 
sd.BufferDesc.Width = mClientWidth; 
sd.BufferDesc.Height = mClientHeight; 
sd.BufferDesc.RefreshRate.Numerator = 60; 
sd.BufferDesc.RefreshRate.Denominator = 1; 
sd.BufferDesc.Format = mBackBufferFormat; 
sd.BufferDesc.ScanlineOrdering = DXGI MODE SCANLINE ORDER UNSPECIFIED; 
sd.BufferDesc.Scaling = DXGI MODE_ SCALING UNSPECIFIED; 
sd.SampleDesc.Count = m4xMsaaState ? 4 : 1; 
sd.SampleDesc.Quality = m4xMsaaState ? (m4xMsaaQuality - 1) : 9; 
sd.BufferUsage = DXGI _ USAGE RENDER TARGET_ OUTPUT; 
sd.BufferCount = SwapChainBufferCount; 
sd.OutputWindow = mhMainwnd; 
sd.Windowed = true; 
sd.SwapEffect = DXGI SWAP_ EFFECT_ FLIP_DISCARD; 
sd.Flags = DXGI SWAP CHAIN FLAG ALLOW MODE SWITCH; 
// 注 意 ， 交 换 链 需 要 通过 命令 队列 对 其 进行 刷新 
ThrowIfFailed(mdxgiFactory->CreateSwapChain( 
mCommandQueue .Get()， 
&sd， 
mSwapChain.GetAddressOf())); 





























4.3.6 ”创建 摘 述 符 堆 


我 们 需要 通过 创建 描述 符 堆 来 存储 程序 中 要 用 到 的 描述 符 / 视 图 
(参见 4.1.6 节 ) 。 对 此 ，Direct3D 12 以 ID3D12DescriptorHeap 接 口 
表示 摘 述 符 堆 ， 并 用 ID3D12Device: :CreateDescriptorHeap 方 法 来 

创建 它 。 在 本 章 的 示例 程序 中 ， 我 们 将 为 交换 链 中 
SwapChainBufferCount 个 用 于 演 染 数据 的 缓冲 区 资源 创建 对 应 的 演 染 
目标 视图 (Render Target View，RTV) ， 并 为 用 于 深度 测试 (depth 
test〉 的 深度 /模板 缓冲 区 ee 
View，DSV) 。 所 以 ， 我 们 此 时 需要 创建 两 个 描述 符 堆 ， 其 一 用 来 存储 
eel 而 那 另 一 个 描述 从 则 则 来 害 策划 
DSV。 现 通过 下 述 代码 来 创建 这 两 个 描述 符 堆 : 








CompPtr<ID3D12DescriptorHeap> mRtvHeap 

CompPtr<ID3D12DescriptorHeap> mDsvHeap 

void D3DApp: :CreateRtvAndDsvDescriptorHeaps() 

{ 
D3D12 DESCRIPTOR HEAP_DESC rtvHeapDesc; 
rtvHeapDesc.NumDescriptors = SwapChainBufferCount; 
rtvHeapDesc.Type = D3D12 DESCRIPTOR HEAP_TYPE_RTV; 
rtvHeapDesc.Flags = D3D12 DESCRIPTOR HEAP FLAG NONE; 

rtvHeapDesc.NodeMask = 

ThrowIfFailed(md3dDevice->CreateDescriptorHeap( 


&rtvHeapDesc, IID PPV_ARGS(mRtvHeap.GetAddressOf()))); 


D3D12_DESCRIPTOR HEAP_DESC dsvHeapDesc; 

dsvHeapDesc.NumDescriptors = 1; 

dsvHeapDesc.Type = D3D12 DESCRIPTOR HEAP_TYPE_DSYV; 

dsvHeapDesc.Flags = D3D12 DESCRIPTOR_ HEAP_FLAG NONE; 
dsvHeapDesc.NodeMask = 

ThrowIfFailed(md3dDevice->CreateDescriptorHeap( 
&dsvHeapDesc, IID PPV_ ARGS(mDsvHeap.GetAddressOf()))); 





在 本 书 的 应 用 框架 中 有 以 下 定义 : 


static const int SwapChainBufferCount = 2; 


int mCurrBackBuffer = 0; 


其 中 ，mCurrBackBuffer 是 用 来 记录 当前 后 台 绥 冲 区 的 索引 《由 
于 利用 页 面 翻转 技术 来 交换 前 人 台 绥 冲 区 和 后 人 台 绥 冲 区 ， 上 所 以 我 们 需要 对 
其 进行 记录 ， 以 便 搞 清楚 哪个 缓冲 区 才 是 当前 正在 用 于 泻 染 数据 的 后 台 
缓冲 区 )。 








创建 插 述 符 堆 之 后 ， 还 要 能 访问 其 中 所 存 的 描述 符 。 在 程序 中 ， 我 
们 是 通过 句柄 来 引用 描述 符 的 ， 并 以 
ID3D12DescriptorHeap: :GetCPUDescriptorHandleForHeapStart 
方法 来 获得 描述 符 堆 中 第 一 个 描述 符 的 句柄 。 倡 助 下 列 函 数 即 可 获取 当 
前 后 台 绥 冲 区 的 RTV 与 DSV: 


D3D12 CPU_ DESCRIPTOR HANDLE D3DApp::CurrentBackBufferView()const 











{ 
// CD3DX12 构 造 函 数 根据 给 定 的 偏 移 量 找到 当前 后 台 绥 冲 区 的 RTV 
return CD3DX12 CPU_DESCRIPTOR HANDLE( 
mRtvHeap->GetCPUDescriptorHandleForHeapStart(),// 推 中 的 首 个 句柄 
mCurrBackBuffer， // 偏 移 至 后 台 绥 冲 区 描述 符 句 柄 的 索引 
mRtvDescriptorsize); // 描述 符 所 占 字 节 的 大 小 














} 


D3D12 CPU_ DESCRIPTOR HANDLE D3DApp: :DepthStencilView()const 


{ 
return mDsvHeap->GetCPUDescriptorHandleForHeapStart(); 


} 





通过 这 段 示例 代码 ， 我 们 就 能 够 看 出 描述 符 大 小 的 用 途 了 。 为 了 用 
偏 移 量 找到 当前 后 台 绥 冲 区 的 RTV 描述 符 B31， 我 们 就 必须 知道 RTV 描 
述 符 的 大 小 。 





4.3.7 创建 演 染 目标 视图 


如 4.1.6 节 中 所 述 ， 资 源 不 能 与 渔 染 流 水 线 中 的 阶段 直接 绑 定 ， 所 以 
我 们 必须 先 为 资源 创建 视图 (描述 符 ) ， 并 将 其 绑 定 到 流水 线 阶 段 。 例 
如 ， 为 了 将 后 台 绥 冲 区 绑 定 到 流水 线 的 输出 合并 阶段 (output merger 
stage， 这 样 Direct3D 才 能 同 其 泻 染 ) ， 便 需要 为 该 后 台 绥 冲 区 创建 一 个 
泻 染 目标 视图 。 而 这 第 一 个 步骤 就 是 要 获得 存 于 交换 链 中 的 绥 冲 区 资 














HRESULT IDXGISwapChain: :GetBuffer( 
UINT Buffer， 


REFIID riid， 
void **ppSurface); 





1. Buffer: 希望 获得 的 特定 后 台 绥 冲 区 的 索引 (有 时 后 台 绥 冲 区 
并 不 只 一 个 ， 所 以 需要 用 索引 来 指明 〉。 


2. riid: 和 希望 获得 的 ID3D12Resource 接 口 64 的 COM ID。 


3. ppSurface: 返回 一 个 指向 ID3D12Resource 接 口 的 指针 ， 这 便 
是 希望 获得 的 后 台 绥 冲 区 。 


调用 IDXGISwapChain: :GetBuffer 方 法 会 增加 相关 后 台 绥 冲 区 的 
COM5 引 用 计数 ， 所 以 在 每 次 使 用 后 一 定 要 将 其 释放 。 通 过 ComPtr 便 可 
以 自动 做 到 这 一 点 。 





接 下 来 ， 使 用 ID3D12Device: :CreateRenderTargetView 方 法 来 
为 获取 的 后 台 组 冲 区 创建 泻 染 目标 视图 。 


void ID3D12Device::CreateRenderTargetView( 
ID3D12Resource *pResource, 


const D3D12_RENDER_TARGET_VIEN_DESC *pDesc， 
D3D12_CPU_DESCRIPTOR_HANDLE DestDescriptor); 
1. pResource: 指定 用 作 演 染 目 标的 资源 。 在 上 面 的 例子 中 是 后 
台 绥 冲 区 〔( 即 为 后 台 绥 冲 区 创建 了 一 个 泻 染 目标 视图 ) 。 


2. pDesc: 指向 D3D12_RENDER_TARGET_VIEW_DESC 数 据 结构 实例 
的 指针 。 该 结构 体 描述 了 资源 中 元 素 的 数据 类 型 (格式) 。 如 果 该 资源 
在 创建 时 已 指定 了 有 具体 格式 〈 即 此 资源 不 是 无 类 型 格式 ，not 
typeless) ， 那 么 束 可 以 把 这 个 参数 设 为 空 指针 ， 表 示 采 用 该 资源 创建 
时 的 格式 ， 为 它 的 第 一 个 mipmap 层 级 (后 台 绥 冲 区 只 有 一 种 mipmap 层 
级 ， 有 关 mipmap 的 内 容 将 在 第 9 对 展开 讨论 ) 创建 一 个 视图 。 由 于 已 经 
指定 了 后 台 绥 冲 区 的 格式 ， 因 此 就 将 这 个 参数 设置 为 空 指针 。 


3. DestDescriptor: 引用 所 创建 泻 染 目标 视图 的 描述 符 句 柄 。 





下 面 的 示例 通过 调用 这 两 种 方法 为 交换 链 中 的 每 一 个 绥 冲 区 都 创建 
了 一 个 RTV: 





CompPtr<ID3D12Resource> mSwapChainBuffer[SwapChainBufferCount]; 

CD3DX12 CPU DESCRIPTOR HANDLE rtvHeapHandle( 
mRtvHeap->GetCPUDescriptorHandleForHeapStart()); 

for (UINT i = 6;j i «< SwapChainBufferCount; i++) 

















// 获得 交换 链 内 的 第 i 个 缓冲 区 
ThrowIfFailed(mSwapChain->GetBuffer( 
i, IID PPV_ARGS(&mSwapChainBuffer[i]))); 


// 为 此 缓冲 区 创建 一 个 RTV 
md3dDevice->CreateRenderTargetView( 
mSwapChainBuffer[i].Get(), nullptr, rtvHeapHandle); 

















// 偏 移 到 描述 符 堆 中 的 下 一 个 缓冲 区 
rtvHeapHandle.Offset(1, mRtvDescriptorSize); 





4.3.8 ”创建 深度 /模板 缓冲 区 及 其 视图 





现在 来 创建 程序 中 所 需 的 深度 /模板 缓冲 区 。 正 如 4.1.5 节 所 述 ， 深 
度 缓冲 区 其 实 就 是 一 种 2D 纹 理 ， 它 存储 着 离 观 察 者 最 近 的 可 视 对 象 的 
深度 信息 《如 果 使 用 了 模板 ， 还 会 附 有 模板 信息 ) 。 纹 理 是 一 种 GPU 资 
源 ， 因 此 我 们 要 通过 填写 D3D12_RESOURCE_DESC 结 构 体 来 描述 纹理 资 
源 ， 再 用 ID3D12Device: :CreateCommittedResource 方 法 来 创建 








它 。D3D12_RESOURCE_DESC 结 构 体 的 定义 如 下 [351。 


typedef struct D3D12 RESOURCE_DESC 


D3D12 RESOURCE DIMENSION Dimension; 
UINT64 Alignment; 

UINT64 Width; 

UINT Height; 

UINT16 DepthOrArraySize; 

UINT16 MipLevels; 

DXGI_ FORMAT Format; 

DXGI_ SAMPLE DESC SampleDesc; 

D3D12 TEXTURE LAYOUT Layout; 

D3D12 RESOURCE MTSC_ FLAG Misc Flags; 
D3D12 RESOURCE _ DESC; 








1. Dimension: 资源 的 维度 ， 即 为 下 列 枚 举 类 型 中 的 成 员 之 一 。 


enum D3D12_ RESOURCE_DIMENSION 

{ 
D3D12_RESOURCE_DIMENSION_ UNKNOWN 
D3D12_ RESOURCE_DIMENSION BUFFER = 1 


D3D12_ RESOURCE_DIMENSION TEXTURE1D 
D3D12_ RESOURCE_DIMENSION_ TEXTURE2D 
D3D12_ RESOURCE_DIMENSION TEXTURE3D 
D3D12_RESOURCE_DIMENSION; 





2. Width: 以 纹 素 为 单位 来 表示 的 纹理 宽度 。 对 于 缓冲 区 资源 来 
说 ， 此 项 是 缓冲 区 占用 的 字 市 数 。 


3. Height: 以 纹 系 为 单位 来 表示 的 纹理 高 度 。 


4. DepthOrArraySize: 以 纹 素 为 单位 来 表示 的 纹理 深度 ， 或 者 
(对 于 1D 纹 理 和 2D 纹 理 来 说 ) 是 纹理 数组 的 大 小 。 注 意 ，Direct3D 中 并 
不 存在 3D 纹 理 数 组 的 概念 。 





5. MipLevels: mipmap 层 级 的 数量 。 我 们 会 在 第 9 章 讲 纹理 时 介 
绍 mipmap 。 对 于 深度 /模板 缓冲 区 而 言 ， 只 能 有 一 个 mipmap 级 别 。 








6. Format: DXGI_FORMAT 枚 举 类 型 中 的 成 员 之 一 ， 用 于 指定 纹 素 
的 格式 。 对 于 深度 /模板 缓冲 区 来 说 ， 此 格式 需要 从 4.1.5 节 介绍 的 格式 
中 选择 。 


7. SampleDesc: 多 重 采样 的 质量 级 别 以 及 对 每 个 像素 的 采样 次 
数 ， 详 情 参 见 4.1.7 节 和 4.1.8 节 。 先 来 回顾 一 下 4X MSAA 技 术 : 为 了 存 
储 每 个 子 像素 的 颜色 和 深度 /模板 信息 ， 所 用 后 台 缓 冲 区 和 深度 缓冲 区 
的 大 小 要 4 倍 于 屏幕 的 分 辨 率 。 因 此 ， 深 度 /模板 缓冲 区 与 泻 染 目 标的 多 
重 采 样 设 置 一 定 要 相 匹 配 。 





8. Layout: D3D12_ TEXTURE_LAYOUT 枚 举 类 型 的 成 员 之 一 ， 用 于 
指定 纹理 的 布局 。 我 们 暂时 还 不 用 考虑 这 个 问题 ， 在 此 将 它 指定 
为 D3D12_ TEXTURE_LAYOUT_UNKNOWN 即 可 。 


9. Flags: 与 资源 有 关 的 杂项 标志 。 对 于 一 个 深度 /模板 绥 冲 区 资 
源 来 说 ， 要 将 此 项 指定 
为 D3D12_RESOURCE_FLAG_ALLOW_DEPTH_STENCILI36]。 








GPU 资源 都 存 于 堆 (heap) 中 ， 其 本 质 是 具有 特定 属性 的 GPU 显存 
块 。ID3D12Device: :CreateCommittedResource 方 法 将 根据 我 们 所 
提供 的 属性 创建 一 个 资源 与 一 个 堆 ， 并 把 该 资源 提交 到 这 个 堆 中 。 


HRESULT ID3D12Device: :CreateCommittedResource( 
const D3D12 HEAP PROPERTIES *pHeapProperties, 
D3D12_HEAP_FLAGS HeapFlags, 
const D3D12 RESOURCE DESC *pDesc, 

D3D12 RESOURCE_ STATES InitialResourceState, 
const D3D12 CLEAR VALUE *pOptimizedClearValue, 
REFIID riidResource, 

void **ppvResource); 


typedef struct D3D12 HEAP PROPERTIES { 
D3D12_HEAP_TYPE Type; 

D3D12 CPU_ PAGE PROPERTY CPUPageProperty; 
D3D12 MEMORY_POOL MemoryPoolPreference; 
UINT CreationNodeMask; 

UINT VisibleNodeMask; 

} D3D12 HEAP PROPERTIESL37],; 





1. pHeapProperties: 资源 欲 提 交 人 至 的 ) 堆 所 具有 的 属性 。 有 
一 些 属性 是 针对 高 级 用 法 而 设 。 目 前 只 需 关 心 
D3D12_HEAP_PROPERTIES 中 的 D3D12_HEAP_TYPE 枚 举 类 型 这 一 主要 属 
性 ， 其 中 的 成 员 列举 如 下 。 








a) D3D12_HEAP_TYPE_DEFAULT: 默认 堆 (default heap) 。 向 这 
堆 里 提交 的 资源 ， 唯 独 GPU 可 以 访问 。 举 一 个 有 关 深 上 度 / 模 板 绥 冲 区 的 
例子 : GPU 会 读 写 深度 /模板 缓冲 区 ， 而 CPU 从 不 需要 访问 它 ， 所 以 深 


度 / 借 板 缓冲 区 应 被 放 入 默认 堆 中 。 


b) D3D12_HEAP_TYPE_UPLOAD: 上 传 堆 (upload heap) 。 疝 此 堆 
里 提交 的 都 是 需要 经 CPU 上 传 至 GPU 的 资源 。 


c) D3D12_HEAP_TYPE_READBACK: 回 读 堆 (read-back heap) 。 辣 
这 种 堆 里 提交 的 都 是 需要 由 CPU 读 取 的 资源 。 


d) D3D12_HEAP_TYPE_CUSTOM: 此 成 员 应 用 于 高 级 场景 一 一 更 多 
言 息 可 详 风 MSDN 文 档 。 


2. HeapFlags: 与 (资源 欲 提交 人 至 的 ) 堆 有 关 的 额外 选项 标志 。 
通常 将 它 设 为 D3D12_HEAP_FLAG_NONEL381。 


3. pDesc: 指向 一 个 D3D12_RESOURCE_DESC 实 例 的 指针 ， 用 它 描 
述 待 建 的 资源 。 


4. InitialResourceState: 回顾 4.2.3 节 的 内 容 可 知 ， 不 管 何 
时 ， 每 个 资源 都 会 处 于 一 种 特定 的 使 用 状态 。 在 资源 创建 时 ， 需 要 用 此 
参数 来 设置 它 的 初始 状态 。 对 于 深度 /模板 缓冲 区 来 说 ， 通 第 将 其 初始 
状态 设置 为 D3D12_RESOURCE_STATE_COMMON， 再 利 
用 ResourceBarrier 方 法 辅 以 D3D12_RESOURCE_ 
STATE_DEPTH_WRITE 状 态 ， 将 其 转换 为 可 以 绑 定 在 演 染 流水 线 上 的 深 
度 /模板 缓冲 区 中。 


5. pOptimizedClearValue: 指 同 一 个 D3D12_CLEAR_VALUE 对 象 


的 指针 ， 它 描述 了 一 个 用 于 清除 资源 的 优化 值 。 选 择 适 当 的 优化 清除 
值 ， 可 提高 清除 操作 的 执行 速度 。 知 不 希望 指定 优化 清除 值 ， 可 把 此 参 
数 设 为 nullptr。 


struct D3D12_ CLEAR_VALUE 


DXGI_ FORMAT Format; 
union 


FLOAT Color[ 4 |]; 
D3D12 DEPTH_STENCIL VALUE DepthStencil; 





D3D12_CLEAR_VALUE ; 


6. riidResource: 我 们 希望 获得 的 ID3D12Resource 接 口 的 COM 
ID 。 


7. ppvResource: 返回 一 个 指向 ID3D12Resource 的 指针 ， 即 新 
建 的 资源 。 


为 了 使 性 能 达到 最 佳 ， 通 各 应 将 资源 放置 于 默认 堆 中 。 只 有 在 需要 
使 用 上 传 堆 或 回 读 堆 的 特性 之 时 ， 才 选用 其 他 类 型 的 堆 。 


男 外 ， 在 使 用 深度 /模板 缓冲 区 之 前 ， 一 定 要 创建 相关 的 深度/ 模板 
视图 ， 并 将 它 绑 定 到 泻 染 流水 线 上 。 这 个 流程 类 似 于 创建 泻 染 目标 视 


图 。 下 面 的 代码 演示 了 该 如 何 创建 深度 /模板 纹理 及 相应 的 深度 /模板 视 


图 : 





// 创建 深度 /模板 组 神 区 及 




















视图 


D3D12 RESOURCE DESC depthStencilDesc; 


depthStencilDesc 
depthStencilDesc 
depthStencilDesc 
depthStencilDesc 
depthStencilDesc 
depthStencilDesc 


depthStencilDesc 
depthStencilDesc 
: 0; 

depthStencilDesc 
depthStencilDesc 


.SampleDesc.Count = m4xMsaaState ? 4 : 
.SampleDesc.Quality = m4xMsaaState ? (m4xMsaaQuality - 1) 


.Dimension = D3D12 RESOURCE DIMENSION TEXTURE2D; 
.Alignment = ©; 

.Width = mClientWidth; 

.Height = 
.DepthOrArraySize = 
.MipLevels = 
depthStencilDesc. 


mClientHeight; 
1; 
1; 

Format = mDepthStencilFormat; 


1; 


.Layout = D3D12 TEXTURE_ LAYOUT_UNKNOWN; 
.Flags = 


D3D12_ RESOURCE_FLAG ALLOW DEPTH_ STENCIL; 


D3D12_CLEAR VALUE optClear; 


optClear .Format 


optClear .DepthStencil.Depth = 


mDepthStencilFormat; 
1.6f; 


optClear .Depthstencil.stencil = 60) 
ThrowIfFailed(md3dDevice->CreateCommittedResource( 
&CD3DX12_HEAP_PROPERTIES(D3D12 HEAP TYPE_DEFAULT), 
D3D12_HEAP_FLAG NONE, 
&depthStencilDesc, 
D3D12 RESOURCE_ STATE_ COMMON, 


&optClear， 


IID_PPV_ARGS(mDepthstencilBuffer.GetAddressof()))); 


// 利用 此 资源 的 格式 ， 为 整个 资源 的 第 6 mip 层 创建 描述 符 
md3dDevice->CreateDepthStencilView( 
mDepthStencilBuffer .Get(), 
nullptr, 
DepthStencilView()); 

















// 将 资源 从 初始 状态 转换 为 深度 缓冲 区 


mCommandList->ResourceBarrier( 


1， 


&CD3DX12 RESOURCE BARRIER: :Transition( 
mDepthStencilBuffer .Get(), 
D3D12 RESOURCE_ STATE COMMON, 
D3D12_ RESOURCE STATE DEPTH WRITE)); 








注意 ， 刚 刚 采 用 了 CD3DX12_HEAP_PROPERTIES 辅 助 构造 函数 来 创 
建 堆 的 属性 结构 体 ， 它 的 具体 实现 如 下 : 


explicit CD3DX12 HEAP_ PROPERTIES( 
D3D12_HEAP_TYPE type, 
UINT creationNodeMask = 1， 
UINT nodeMask = 1 ) 
{ 
Type = type; 
CPUPageProperty = D3D12_CPU_PAGE_PROPERTY_UNKNOWN ; 


MemoryPoolPreference = D3D12 MEMORY_ POOL UNKNOWN; 
CreationNodeMask = creationNodeMask; 
VisibleNodeMask = nodeMask ; 





CreateDepthstencilView 方 法 的 第 二 个 参数 是 指 

向 D3D12_DEPTH_STENCIL_VIEW_DESC 结 构 体 的 指针 。 这 个 结构 体 描述 

了 资源 中 元 素 的 数据 类 型 (格式 ) 。 如 果 资 源 在 创建 时 已 指定 了 具体 格 
式 《〈 即 此 资源 不 是 无 类 型 格式 ) ， 那 么 就 可 以 把 该 参数 设 为 空 指针 ， 表 
示 以 该 资源 创建 时 的 格式 为 它 的 第 一 个 mipmap 层 级 创建 一 个 视图 (在 

创建 深度 /模板 绥 冲 区 时 就 只 有 一 个 mipmap 层 级 ，mipmap 的 相关 知识 将 
在 第 9 章 中 进行 讨论 ) 。 由 于 我 们 已 经 为 深度 /模板 缓冲 区 设置 了 有 具体 格 
式 ， 所 以 向 此 参数 传 入 空 指针 。 


4.3.9 ”设置 视 口 
我 们 通常 会 将 3D 场 景 绘制 到 与 整个 屏幕 〈 在 全 屏 模式 下 ) 或 整个 


窗口 工作 区 大 小 相当 的 后 台 缓 冲 区 中 。 as 
绘制 到 后 台 缓 冲 区 的 某 个 矩形 子 区 域 当中 ， 如 图 4.9 所 示 。 
































图 4.9 ”通过 修改 视 口 ， 我 们 就 能 将 3D 场 景 绘制 到 后 台 绥 冲 区 内 的 矩形 子 区 域 当 中 ， 
继而 使 后 台 绥 冲 区 中 的 内 容 呈 现在 窗口 的 工作 区 范围 之 内 
































我 们 把 后 台 绥 冲 区 中 的 这 种 矩形 子 区 域 叫 作 视 口 (viewport) ， 并 
通过 下 列 结构 体 来 描述 它 : 


typedef struct D3D12 VIEWPORT { 
FLOAT TopLeftX; 
FLOAT TopLeftY; 
FLOAT Width 


FLOAT Height; 

FLOAT MinDepth; 
FLOAT MaxDepth ; 
D3D12 VIEWPORT; 





结构 体 中 的 前 4 个 数据 成 员 定 义 了 视 口 矩形 (viewport rectangle) 相 
对 于 后 台 绥 冲 区 的 绘制 范围 “由 于 数据 成 员 是 用 float 类 型 表示 的 ， 所 
以 我 们 能 够 以 小 数 精度 来 指定 像素 坐标 ) [4 中。 在 Direct3D 中 ， 存 储 在 深 
度 缓冲 区 中 的 数据 都 是 范围 在 0 一 1 的 归 一 化 深度 值 。MinDepth 和 
MaxDepth 这 两 个 成 员 负 责 将 深度 值 从 区 间 [0, 1 转换 到 区 间 [MinDepth， 
MaxDepth]。 通 过 对 深度 范围 进行 转换 即 可 实现 某 些 特效 ， 例 如 ， 我 们 
可 以 依次 设置 MinDepth=6 和 MaxDepth=8， 用 此 视 口 绘制 的 物体 其 深度 





值 都 为 0， 它 们 将 比 场景 中 其 他 物体 的 位 置 都 更 靠 前 。 然 而 ， 在 大 多 数 
情况 下 通常 会 把 MinDepth 与 MaxDepth 分 别 设置 为 0 与 1， 也 就 是 令 深 度 
值 保 持 不 变 。 


只 要 填写 好 D3D12_VIEWPORT 结 构 体 ， 便 可 以 
用 ID3D12GraphicsCommandList: :RSSetViewports 方 法 来 设置 
Direct3D 中 的 视 口 了 。 下 面 的 示例 是 通过 创建 并 设置 一 个 视 口 ， 将 场景 
绘 至 整个 后 全 缓冲 区 : 





D3D12 VIEWPORT vp; 
vp.TopLeftX = 6.6f; 
vp.TopLeftY = 60.6f; 
vp.Width = static cast<float>(mClientWidth); 


vp.Height = static cast<float>(mClientHeight); 
vp.MinDepth = 8.ef; 
vp.MaxDepth = 1.6f; 





mCommandList->RSSetViewports(1, &vp); 





第 一 个 参数 是 要 绑 定 的 视 口 数量 (有些 高 级 效果 需要 使 用 多 个 视 
口 )， 第 二 个 参数 是 一 个 指向 视 口 数组 的 指针 。 


注意 Note i 


不 能 为 同一 个 演 染 目标 指定 多 个 视 口 。 而 多 视 口 (multiple 
viewport) 则 是 一 种 用 于 对 多 个 泻 染 目标 同时 进行 泻 染 的 高 级 技术 。 


注意 Note ~ 








命令 列表 一 旦 被 重 置 ， 视 口 也 就 需要 随 之 而 重 置 。 


事实 上 ， 还 可 以 用 视 口 技术 来 实现 双人 游戏 的 分 屏 (split screen) 
模式 。 首 先 创 建 两 个 视 口 ， 一 个 占 屏 幕 左 半 部 ， 另 一 个 占 右 半 部 。 接 下 
来 ， 在 左 视 口中 以 玩家 1 的 视角 来 绘制 3D 场 景 ， 再 在 右 视 口 中 以 玩家 2 
的 视角 来 绘制 3D 场 景 即 可 。 











4.3.10 ”设置 裁 勇 定形 


我 们 可 以 相对 于 后 台 绥 冲 区 定义 一 个 裁 西 滤 形 (scissor 
rectangle) ， 在 此 和 矩形 外 的 像素 都 将 被 吻 除 〈( 即 这 些 图 像 部 分 将 不 会 被 
光栅 化 (rasterize〉 人 至 后 台 绥 冲 区 〉 。 这 个 方法 能 用 于 优化 程序 的 性 

。 例 如 ， 假 设 已 知 有 一 个 矩形 的 UI (user interface， 用 户 界 面 ) 元 素 
nt 异 和 项 中 某 块 区 域 的 最 上 层 ， 那 么 我 们 也 就 无 须 对 3D 空 间 中 那些 被 
它 遮 挡 的 像 隶 进行 处 理 了 。 


裁剪 矩形 由 类 型 为 RECT 的 D3D12_RECT 结 构 体 (typedef RECT 
D3D12_RECT; ) 定义 而 成 : 


typedef struct tagRECT 


LONG left; 

LONG top; 

LONG right; 

LONG bottom; 
} RECT; 





在 Direct3D 中 ， 要 
用 ID3D12GraphicsCommandList::RSSsetSscissorRects 方 法 来 设置 裁 
前 算 形 。 下 面 的 示例 将 创建 并 设置 一 个 履 六 后 台 绥 冲 区 左上 角 1/4 区 域 
的 裁 藤 矩形 : 








mScissorRect = { 6, 8, mClientWidth/2, mClientHeight/2 }; 


mCommandList->RSSetScissorRects(1, &mScissorRect); 





类 似 于 RSSetViewports 方 法 ，RSSetScissorRects 方 法 的 第 一 
参数 是 要 绑 定 的 裁剪 矩形 数量 〈 为 了 实现 一 些 高 级 效果 有 时 会 采用 多 个 
裁剪 定形 ) ， 第 二 个 参数 是 指 回 一 个 裁剪 矩形 数组 的 指针 。 


不 能 为 同一 个 泻 染 目标 指定 多 个 裁剪 矩形 。 多 裁剪 矩形 (multiple 
scissor rectangle) 是 一 种 用 于 同时 对 多 个 演 染 目标 进行 泻 染 的 高 级 技 
es 


注意 Note Co 


裁 甬 矩形 需要 随 着 命令 列表 的 重 置 而 重 置 。 


4.4 计时 与 动画 


为 了 制作 出 精准 的 动画 效果 就 需要 精确 地 计量 时 间 ， 特 别 是 要 准确 
地 度量 出 动画 每 帧 画面 之 间 的 时 间 间 隔 。 如 果 帧 率 〈frame rate， 也 有 作 
帧 速率 、 帧 频 等 ， 每 秒 刷 新 的 帧 数 〉 较 高 ， 那 么 帧 与 帧 之 间 的 间隔 就 会 
比较 短 ， 此 时 我 们 就 要 用 到 高 精度 的 计时 器 。 








4.4.1 ”性 能 计时 器 


为 了 精确 地 度量 时 间 ， 我 们 将 采用 性 能 计时 器 (performance 
timer。 或 称 性 能 计数 器 ，performance counter) 。 如 果 希 望 调 用 查询 性 
能 计时 器 的 Win32 函 数 ， 我 们 必须 引入 头 文件 #include 


<windows.h>。 


性 能 计时 器 所 用 的 时 间 上 度量 单位 叫 作 计数 (count) 。 可 调 
用 QueryPerformanceCounter 函 数 来 获取 性 能 计时 器 测量 的 当前 时 刻 
值 《 以 计数 为 单位 ) : 


_ int64 currTime; 
QueryPerformanceCounter((LARGE INTEGER*)&currTime); 
观察 可 知 ， 此 函数 通过 参数 返回 的 当前 时 刻 值 是 个 64 位 的 整数 。 


再 用 QueryPerformanceFrequency 函 数 来 获取 性 能 计时 器 的 频率 
〈 单 位: 计数 / 秒 ) : 





int64 countsPersec 
QueryPerformanceFrequency((LARGE_INTEGER*k )&countsPersec ) ; 


每 个 计数 所 代表 的 秒 数 〈 或 称 几 分 之 一 秒 ) ， 即 为 上 述 性 能 计时 器 
频率 的 倒数 : 


mSecondsPerCount = 1.6 / (double)countsPersec ; 


因此 ， 只 需 将 读 取 的 时 刻 计数 值 valueInCounts 乘 以 转换 因 
子 mSecondsPerCount， 就 可 以 将 其 单位 转换 为 秒 : 


valueInSecs = ValueInCounts * mSecondsPerCount; 


对 我 们 而 言 ， 单 次 调用 QueryPerformanceCounter 函 数 所 返回 的 
时 刻 值 并 没有 什么 特别 的 意义 。 如 采 隔 一 人 小段 时 间 ， 再 调用 一 次 该 函 
数 ， 并 得 到 此 时 的 时 刻 值 ， 我 们 就 会 发 现 这 两 次 调用 的 时 刻 间 隔 即 为 两 
个 返回 值 的 拳 。 因 此 ， 我 们 总 是 以 两 个 时 间 稚 (time stamp) 的 相对 差 
值 ， 而 非 性 能 计数 器 单 次 返回 的 实际 值 来 度量 时 间 。 通 过 下 面 的 代码 来 
明确 这 一 想法 : 


int64 A = 0; 
QueryPerformanceCounter((LARGE INTEGER*)&A); 











// 执行 预定 的 逻辑 





__int64 B = 0 
QueryPerformanceCounter((LARGE INTEGER*)&B); 








利用 (B-A) 即 可 获得 代码 执行 期 间 的 计数 值 ， 或 以 (B- 
A)*mSecondsPerCount 获 取代 码 运 行 期 间 所 花费 的 秒 数 [41。 





MSDN 对 QueryPerformanceCounter 函 数 作 有 如 下 备注 : “ 按 道理 
来 讲 ， 对 于 一 台 具 有 多 个 处 理 器 的 计算 机 而 言 ， 无 论 在 哪 一 个 处 理 器 上 
调用 此 函数 都 应 返回 当前 时 刻 的 计数 值 。 然 而 ， 由 于 基本 输入 /输出 系 
统 (BIOS) 或 硬件 抽象 层 CHAL) 上 的 缺陷 ， 导 致 了 在 不 同 的 处 理 器 
上 可 能 会 得 到 不 同 的 结果 [4 外。”»” 对 此 ， 我 们 可 以 通过 
SetThreadAffinityMask 函 数 ， 防 止 应 用 程序 的 主线 程 切换 到 其 他 的 
处 理 器 上 去 执行 指令 ， 从 而 实现 每 次 都 能 在 同一 处 理 器 上 两 次 调 
用 QueryPerformanceCounter 函 数 ， 得 到 正确 的 计数 差 值 。 





4.4.2 ”游戏 计时 丹 次 





在 接 下 来 的 两 小 节 中 ， 我 们 将 讨论 以 下 GameTimer 类 的 实现 : 





class GameTimer 


public: 
GameTimer(); 


float TotalTime()const; // 用 秒 作 为 单位 
float DeltaTime()const; // 用 秒 作为 单位 


void Reset(); // 在 开始 消息 循环 之 前 调用 
void Start(); // 解除 计时 器 暂停 时 调用 
void Stop(); // 暂停 计时 器 时 调用 
void Tick(); // 每 帧 都 要 调用 





private: 
double mSecondsPerCount; 
double mDeltaTime; 


int64 mBaseTime; 
int64 mpPausedTime ; 
int64 mStopTime; 
int64 mpPrevTime 
int64 mCurrTime; 


bool mStopped; 





此 类 的 构造 函数 会 得 询 性 能 计数 器 的 频率 。 另 外 几 个 成 员 函 数 将 在 
后 面 的 两 小 节 中 讨论 。 


GameTimer: :GameTimer() 

: mSecondsPerCount(6.6)，mDeltaTime(-1.6)，mBaseTime(6)， 
mPausedTime(6)，mPrevTime(6)，mCurrTime(6)，mstopped(false) 
{ 


__int64 countsPersec ; 
QueryPerformanceFrequency((LARGE INTEGER*)&countsPerSec); 
mSecondsPerCount = 1.6 / (double)countsPersec ; 





GameTimer 类 的 实现 位 于 GameTimer.h 和 GameTimer.cpp 文 件 之 
中 ， 可 以 在 本 书 源 代码 的 Common 目 录 里 找到 。 


4.4.3， 帧 与 帧 之 间 的 时 间 间 隔 


当 演 染 动 画 帧 时 ， 我 们 需要 知道 每 帧 之 间 的 时 间 间 隔 ， 以 此 来 根据 
时 间 的 流逝 对 游戏 对 象 进 行 更 新 。 计 算 帧 与 帧 之 间 间 隔 的 流程 如 下 。 假 
设 在 开始 显示 第 i 帧 画面 时 ， 性 能 计数 占 返 回 的 时 刻 为 ft， 而 此 前 的 一 帧 
ie 性 能 计数 器 返回 的 时 刻 为 1。 那么 ， 这 两 帧 的 时 间 间 隔 





就 是 At 一 一 1。 对 于 实时 泻 染 来 说 ， 为 了 保证 动画 的 流畅 性 至 少 需 
要 每 秒 刷新 30 帧 (实际 上 通常 会 采用 更 高 的 帧 率 ) ， 所 以 t= 一 本 
往往 是 个 较 小 的 数值 。 


CI 


计算 At 的 代码 如 下 : 


void GameTimer::Tick() 


{ 
if( mStopped ) 


mDeltaTime = 8.0; 
return; 


} 
// 获得 本 帧 开始 显示 的 时 刻 


__int64 currTime; 
QueryPerformanceCounter((LARGE INTEGER*)&currTime); 
mCurrTime = currTime; 


// 本 帧 与 前 一 帧 的 时 间 差 


mDeltaTime = (mCurrTime - mprevTime)*mSecondsPerCount; 








// 准备 计算 本 帧 与 下 一 帧 的 时 间 差 


mprevTime = mCurrTime; 















































// 使 时 间 差 为 非 负 值 。DXSDK 中 的 CDXUTTimer 示 例 注释 里 提 到 : 如 果 处 理 器 处 于 节能 
模式 ， 或 者 在 

// 计算 两 帧 间 时 间 差 的 过 程 中 切换 到 另 一 个 处 理 器 时 〈 即 QueryPerformanceCounter 
函数 的 两 次 调 

// 用 并 非 在 同一 处 理 器 上 ) ， 则 mpDeltaTime 有 可 能 会 成 为 负 值 

if(mDeltaTime < 6.0) 

{ 



























































mDeltaTime = 8.0; 


} 
} 


float GameTimer::DeltaTime()const 


return (float)mDeltaTime; 





Tick 函 数 航 调用 于 程序 的 消息 循环 之 中 : 


int D3DApp: :Run() 


{ 
MSG msg = {0}; 


mTimer.Reset(); 


while(msg.message != WM QUIT) 
{ 
// 如 果 有 窗口 消息 就 进行 处 理 
if(PeekMessage( &msg, 60, 60, 060, PM REMOVE )) 





























TranslateMessage( &msg ); 
DispatchMessage( &msg ); 


} 
// 否则 就 执行 动画 与 游戏 的 相关 逻辑 
else 


{ 


mTimer.Tick(); 
if( !mAppPaused ) 


CalculateFrameStats(); 
Update(mTimer); 
Draw(mTimer); 


} 


else 


Sleep(1060); 


return (int)msg.wParam; 


} 





采用 这 种 方案 时 ， 我 们 需要 在 每 一 帧 都 计算 At， 并 将 其 送 
入 Update 方 法 。 只 有 这 样 ， 才 可 以 根据 前 一 动画 帧 所 花费 的 时 间 对 场 
景 进行 更 新 。 以 下 是 Reset 方 法 的 具体 实现 : 





void GameTimer: :Reset() 


{ 


__int64 currTime 


QueryPerformanceCounter((LARGE_ INTEGER*)&currTime); 


mBaseTime = currTime; 
mpPrevTime = currTime; 
mStopTime = 0; 
mStopped = false; 





这 段 代 码 内 的 一 些 变量 还 未 曾 讨 论 (参见 4.4.4 节 ) 。 但 是 可 以 看 
出 ， 在 调用 Reset 时 会 将 mPrevTime 初 始 化 为 当前 时 刻 。 这 一 步 十 分 关 
键 ， 由 于 在 第 一 帧 画面 之 前 没有 任何 的 动画 帧 ， 所 以 此 帧 的 前 一 个 时 间 
稚 #-! 并 不 存在 。 因 此 ， 在 消息 循环 开始 之 前 ， 需 要 通过 Reset 方 法 对 
mpPrevTime 的 值 进行 初始 化 。 





4.4.4 总 时 间 


我 们 还 开展 了 一 项 名 为 总 时 间 (total time) 的 实用 时 间 
统计 : 这 是 一 种 上 自 应 用 程序 开始 ， 不 计 其 中 暂停 时 间 的 时 间 总 和 。 下 面 
的 情景 展示 了 它 所 起 到 的 作用 。 假 设 我 们 制作 的 游戏 需要 玩家 在 300 秒 
内 打通 一 个 关卡 。 关 卡 开始 时 ， 先 来 获取 时 间 tstart， 它 表示 自 程 序 开始 
至 此 关卡 开始 所 经 过 的 时 间 。 在 关卡 开始 后 ， 我 们 会 经 常 检测 由 程序 开 
始 至 当前 的 时 间 t。 如 末 t 一 tstart > 300 秒 ( 见 图 4.10， ， 就 说 明 玩 家 在 此 
关卡 集 留 的 时 间 已 经 超过 300 秒 ， 挑 战 失败 。 不 难 发 现 ， 在 这 种 情景 
中 ， 我 们 并 不 希望 把 玩家 在 游戏 过 程 中 的 暂 集 时 间 也 统计 在 关卡 集 留 的 
时 间 内 ， 而 总 时 间 则 刚好 可 以 满足 这 一 操 








忆 时 间 的 男 一 个 应 用 情景 是 : 驱使 条 量 随时 间 函 数 而 变化 。 举 个 例 
子 ， 假 设 裔 要 根据 茶 个 时 间 函 数 来 得 到 光源 环绕 场景 的 运动 轨迹 ， 那 么 


它 的 位 置 可 以 用 下 列 参数 方程 表示 : 


T= 10cost 
y=20 
z = lO0Osint 


这 里 的 表示 时 间 ， 随 着 {时 间 〉 的 增加 ， 光 源 的 坐标 也 在 不 断 更 
新 ， 从 而 使 它 在 ! = 20 这 一 平面 内 半径 为 10 的 圆周 上 运动 。 对 于 这 种 动 
画 ， 我 们 也 不 希望 把 暂 集 时 间 记 录 在 变化 时 间 内 ， 如 图 4.11 所 示 。 


为 了 统计 总 时 间 ， 我 们 将 使 用 下 列 变 量 : 


__int64 mBaseTime 
__int64 mpPausedTime 
__int64 mStopTime; 























图 4.10 计算 自 游戏 关卡 开始 至 当前 的 时 间 。 注 意 ， 我 们 将 此 应 用 程序 的 开始 时 刻 选 择 为 坐标 
原点 (0)， 并 以 此 作为 参考 系 来 统计 时 间 


















































图 4.11 ”如 果 我 们 在 机 时 暂停 计时 器 ， 在 t2 时 重启 计时 器 ， 并 把 暂停 时 间 记 录 在 内 ， 那 么 用 户 就 
会 看 到 光 点 从 P(t1) 突 然 跳 到 Plt2) 处 








正如 4.4.3 节 中 所 述 ， 在 调用 Reset 函 数 之 时 ， 会 将 mBaseTime 初 始 


化 为 当前 时 刻 。 我 们 可 以 把 这 个 时 刻 当 作 应 用 程序 的 开始 时 刻 。 在 大 多 
数 情况 下 ，Reset 函 数 只 会 在 消息 循环 开始 之 前 调用 一 次 ， 所 以 在 应 用 
程序 的 整个 生命 周期 里 ，mBaseTime 一 般 会 保持 不 变 。 变 量 
mpPausedTime 存 储 的 是 所 有 和 暂停 时 间 之 和 。 这 个 累积 时 间 很 有 存在 的 必 
要 : 为 了 得 到 不 统计 暂停 时 间 的 总 时 间 ， 我 们 可 以 用 程序 的 总 运行 时 间 
减 去 这 个 累加 时 间 算 出 。 变 量 mstopTime 会 给 出 计时 器 停止 〈 和 暂停 ) [43] 
的 时 刻 ， 借 此 即 可 记录 暂停 的 时 间 。 











Stop 和 Start 是 GameTimer 类 中 的 两 个 关键 方法 。 当 应 用 程序 分 别 
处 于 暂停 或 未 暂停 的 状态 时 ， 我 们 就 可 以 依 情况 调用 它们 ， 以 此 令 
GameTimer 能 够 记录 和 暂停 的 时 间 。 代 码 注 释 介 绍 了 这 两 个 方法 的 相关 细 


二 


.: 





void GameTimer::Stop() 














// 如 果 已 经 处 于 停止 状态 ， 那 就 什么 也 不 做 
if( !ImStopped ) 


__int64 currTime; 
QueryPerformanceCounter((LARGE_ INTEGER*)&currTime); 


// 否则 ， 保 存 停止 的 时 刻 ， 并 设置 布尔 标志 ， 指 示 计 时 器 已 经 停止 
mStopTime = currTime; 
mStopped = true; 





} 


void GameTimer::Start() 
{ 
__int64 startTime; 
QueryPerformanceCounter((LARGE_ INTEGER*)&startTime); 

















// 累加 调用 stop 和 start 这 对 方法 之 间 的 暂停 时 刻 间隔 
// 





// ----#--------------- *----------------- *------------ > 时 间 


// mBase Time mStopTime star 


// 如 果 从 停止 状态 继续 计时 的 话 .… 
if( mStopped ) 


// 累加 暂停 时 间 


mpausedTime += (startTime - mStopTime); 





tTime 


// 在 重新 开局 计时 器 时 ， 前 一 帧 的 时 间 mPrevTime 是 无 效 的 ， 这 是 因为 它 存 储 的 











是 暂停 时 前 一 


// 帧 的 开始 时 刻 ， 因 此 需要 将 它 重 置 为 当前 时 刻 

















mpPrevTime = startTime; 


// 已 不 再 是 停止 状态 … 
mStopTime = 6 
mStopped = false; 








最 后 ， 我 们 就 可 以 用 成 员 函 数 TotalTime 返 
始 不 计 和 暂停 时 间 的 总 时 间 了 ， 它 的 具体 实现 如 下 





float GameTimer::TotalTime()const 





{ 
// 如 果 正 处 于 停止 状态 ， 则 忽略 本 次 停止 时 刻 至 当前 时 刻 的 这 段 时 间 。 此 外 ， 如 果 之 前 已 有 





过 和 暂停 的 情况 ， 





回 自 调用 Reset 函 数 开 








// 那么 也 不 应 统计 mstopTime - mBaseTime 这 段 时 间 内 的 暂停 时 间 
// 为 了 做 到 这 一 点 ， 可 以 从 mstopTime 中 再 减 去 暂停 时 间 mPausedTime 














// 
// 前 一 次 暂停 时 间 
// |<--------------- >| 


> 时 间 
// mBase Time mStopTime@ startTime 
ime 


if( mStopped ) 


return (float)(((mStopTime - mpausedTime)- 
mBaseTime)*mSecondsPerCount); 


} 


// 我 们 并 不 希望 统计 mCurrTime - mBaseTime 内 的 暂停 时 间 
// 可 以 通过 从 mCurrTime 中 再 减 去 暂停 时 间 mPausedTime 来 实 



































当前 的 暂停 时 间 
[Res >| 

a nd Ya i 
mStopTime mCurrT 





现 这 一 点 


// 


// (mCurrTime - mpPausedTime) - mBaseTime 





// 
// |<-- 暂停 时 间 -->| 
// ----*--------------- *- *------------ *------ > 时 间 
// mBaseTime mStopTime startTime mCurrTime 
else 
{ 


return (float)(((mCurrTime-mpausedTime)- 
mBaseTime)*mSecondsPerCount); 








在 我 们 的 演示 框架 中 ， 为 了 度量 从 程序 开始 到 某 时 刻 的 总 时 间 而 创 
建 了 一 个 GameTimer 实 例 ， 与 此 同时 ， 也 对 每 帧 之 间 的 时 间 间 隔 进行 了 
测量 。 其 实 ， 我 们 也 可 以 再 创建 一 个 GameTimer 实 例 ， 把 它 当 作 一 个 通 
用 的 “秒表 ”。 例 如 ， 妆 游戏 中 的 炸弹 被 点 燃 时 ， 我 们 可 以 开局 一 个 新 的 
GameTimer 实 例 ， 当 TotalTime 达 到 5 秒 时 就 触发 爆炸 事件 。 





4.5 应 用 程序 框架 示例 


全 书 的 演示 程序 都 使 用 了 d3dUtiLh、d3dUtil.cpp、d3dApp.h 和 
d3dApp.cpp 中 的 框架 代码 ， 可 以 从 本 书 的 官方 网 站 下 载 到 这 些 文件 。 
d3dUtil.h 和 d3dUtil.cpp 文 件 中 含有 程序 所 需 的 实用 工具 代码 ，d3dApp.h 
和 d3dApp.cpp 文 件 内 包含 用 于 封装 Direct3D 示 例 程 序 的 Direct3D 应 用 程 
序 类 核心 代码 。 由 于 在 书 中 不 能 细 述 这 些 文件 里 的 每 一 行 代码 (例如 ， 
我 们 不 会 展示 如 何 创 建 一 个 窗口 ， 基 本 的 Win32 编 程 是 阅读 本 书 的 必 备 
知识 [ 鸣 ) ， 所 以 我 们 鼓励 读者 在 阅读 完 本 章 后 ， 仔 细 研 究 这 些 文件 。 
构建 此 框架 的 目标 是 : 隐 去 窗口 创建 和 Direct3D 初 始 化 的 具体 细节 ; 通 
过 对 这 些 代 码 进 行 封装 ， 那 些 细 枝 末节 就 不 会 分 散 我 们 的 注意 力 ， 继 而 
使 我 们 把 精力 集中 在 重点 代码 上 。 




















4.5.1 D3DApp 类 


D3DApp 类 是 一 种 基础 的 Direct3D 应 用 程序 类 ， 它 提供 了 创建 应 用 程 
序 主 窗口 、 运 行程 序 消 I 处 理 窗 口 消息 以 及 初始 化 Direct3D 等 多 
种 功能 的 函数 。 此 外 ， 该 类 还 为 应 用 程序 例 程 定义 了 一 组 框架 函数 。 我 
们 可 以 根据 需求 通 ei 重 写 (override) 
框架 的 虚 函 数 ， 以 此 从 D3DApp 类 中 派生 出 自 定义 的 用 户 代 码 。D3DApp 
类 的 定义 如 下 : 

















#include "d3dUtil.h" 
#include "GameTimer.h" 


// 链接 所 需 的 d3d12 库 

#pragma comment(1lib,"d3dcompiler.1ib") 
#pragma comment(1ib, "D3D12.1ib") 
#pragma comment(lib, "dxgi.1ib") 


class D3DApp 


{ 
protected: 


D3DApp (HINSTANCE hInstance); 

D3DApp(const D3DApp& rhs) = delete; 

D3DApp& operator=(const D3DApp& rhs) = delete; 
virtual ~D3DApp(); 


public: 
static D3DApp* GetApp(); 


HINSTANCE AppInst()const; 
HWND MainWwnd()const; 
float AspectRatio()const; 


bool Get4xMsaaState()const; 
void Set4xMsaaState(bool value); 


int Run(); 


virtual bool Initialize(); 
virtual LRESULT MsgProc(HWND hwnd, UINT msg, WPARAM wParam, LPARAM lPara 


m); 


protected: 
virtual void CreateRtvAndDsvDescriptorHeaps(); 
virtual void OnResizel(); 
virtual void Update(const GameTimer& gt)=0; 
virtual void Draw(const GameTimer& gt)=0; 














// 便于 重 写 女 标 输入 消息 的 处 理 流程 
virtual void OnMouseDown(WPARAM btnState, int x, int y){ } 
virtual void OnMouseUp(WPARAM btnState, int x, int y) { } 
virtual void OnMouseMove(WPARAM btnState, int x, int y){ } 


protected: 


bool InitMainWindow(); 

bool InitDirect3D(); 

void CreateCommandObjects(); 
void CreateSwapChain(); 


void FlushCommandQueue( ) ; 


ID3D12Resource* CurrentBackBuffer()const 
{ 


} 


D3D12 CPU_ DESCRIPTOR HANDLE CurrentBackBufferView()const 
{ 


return mSwapChainBuffer[mCurrBackBuffer].Get(); 


return CD3DX12 CPU DESCRIPTOR HANDLE( 
mRtvHeap->GetCPUDescriptorHandleForHeapStart(), 
mCurrBackBuffer, 
mRtvDescriptorSize); 


} 


D3D12_CPU_DESCRIPTOR HANDLE DepthstencilView()const 
{ 


} 


return mDsvHeap->GetCPUDescriptorHandleForHeapStart(); 


void CalculateFrameStats(); 

void LogAdapters(); 

void LogAdapterOutputs(IDXGIAdapter* adapter); 

void LogOutputDisplayModes(IDXGIOutput* output, DXGI_ FORMAT format); 
protected: 


static D3DApp* mApp; 








HINSTANCE mhAppInst = nullptr; // 应 用 程序 实例 句柄 
HWND ”mhMainwnd = nullptr; // 主 窗口 句柄 














bool mAppPaused = false; // 应 用 程序 是 否 暂 停 
bool mMinimized = false; // 应 用 程序 是 否 最 小 化 








bool mMaximized = false; // 应 用 程序 是 否 最 大 化 
bool mResizing = false; // 大 小 调整 栏 是 否 受 到 拖 搜 
bool mFullscreenState = false;// 是 否 开启 全 屏 模式 























// 若 将 该 选项 设置 为 true， 则 使 用 4X MSAA 技 术 ( 参 见 4.1.8 节 )。 默 认 值 为 false 
bool m4xMsaaState = false; // 是 否 开启 4X MSAA 
UINT m4xMsaaQuality = 6; // 4X MSAA 的 质量 级 别 














// 用 于 记录 "delta-time"〈 帧 之 间 的 时 间 间 隔 ) 和 游戏 总 时 间 ( 参 见 4.4 节 ) 
GameTimer mTimer; 


Microsoft: :WNWRL: :ComPtr<IDXGIFactory4> mdxgiFactory; 


Microsoft: :WRL: :Comptr<IDXGISwapChain> mSwapChain; 
Microsoft: :WRL: :ComPptr<ID3D12Device> md3dDevice; 


Microsoft: :WRL: :ComPtr<ID3D12Fence> mFence; 
UINT64 mCurrentFence = 0; 


Microsoft: :WRL: :ComPtr<ID3D12CommandQueue> mCommandQueue; 
Microsoft: :WRL: :ComPptr<ID3D12CommandAllocator> mDirectCmdListAlloc; 
Microsoft: :WRL: :Comptr<ID3D12GraphicsCommandList> mCommandList; 


static const int SwapChainBufferCount = 2; 

int mCurrBackBuffer = 0; 

Microsoft: :WRL: :Comptr<ID3D12Resource> mSwapChainBuffer[SwapChainBufferC 
ount]; 

Microsoft: :WRL: :Comptr<ID3D1i2Resource> mDepthStencilBuffer; 


Microsoft: :WRL: :Comptr<ID3D12DescriptorHeap> mRtvHeap; 
Microsoft: :WRL: :Comptr<ID3D12DescriptorHeap> mDsvHeap; 


D3D12 VIEWPORT mScreenViewport; 
D3D12 RECT mScissorRect; 


UINT mRtvDescriptorSize = 
UINT mDsvDescriptorSize = 0; 
UINT mCbvSrvUavDescriptorSize = 0; 


1 
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// 用 户 应 该 在 派生 类 的 派生 构造 函数 中 自 定义 这 些 初始 值 

std: :wstring mMainwndCaption = L"d3d App"; 

D3D_DRIVER_ TYPE md3dDriverType = D3D_DRIVER _ TYPE_HARDWARE; 
DXGI_FORMAT mBackBufferFormat = DXGI_FORMAT_R8G8B8A8_UNORM 
DXGI_FORMAT mDepthStencilFormat = DXGI FORMAT D24 UNORM S8_UINT; 
int mClientWwidth = 860; 

int mClientHeight = 666; 














我 们 在 上 面 的 代码 中 用 注释 描述 了 一 些 数据 成 员 ， 其 中 的 方法 将 陆 
续 在 后 面 的 章节 中 讨论 。 


4.5.2 非 框 架 方 法 


下 面 列举 几 种 常用 的 非 框架 方法 。 


1. D3DApp: 这 个 构造 函数 只 是 简单 地 将 数据 成 员 初 始 化 为 默认 
值 。 


2. ~D3DApp: 这 个 析 构 函数 用 于 释放 D3DApp 中 所 用 的 COM 接 口 对 
象 并 刷新 命令 队列 。 在 析 构 函数 中 刷新 命令 队列 的 原因 是 : 在 销毁 GPU 
引用 的 资源 以 前 ， 必 须 等 待 GPU 处 理 完 队列 中 的 所 有 命令 。 和 否则 ， 可 能 
造成 应 用 程序 在 退出 时 骨 泪 。 


D3DApp: :~D3DApp() 


if(md3dDevice != nullptr) 
FlushCommandQueue(); 





3. AppInst: 简单 的 存 取 函数 ， 返 回应 用 程序 实例 句柄 。 
4. Mainwnd: 简单 的 存 取 函 数 ， 返 回 主 窗口 句柄 。 


5. AspectRatio: 这 个 纵横 比 〈 亦 有 译作 长 宽 比 、 宽 高 比 由 1]) 定 
义 的 是 后 台 缓 冲 区 的 宽度 与 高 度 之 比 。 第 5 章 会 用 到 这 个 比值 。 它 的 实 
现 比 较 简 单 : 


float D3DApp: :AspectRatio()const 
{ 


return static cast<float>(mClientWidth) / mClientHeight; 
} 





6. Get4xMsaaState: 如 果 局 用 4XMSAA 就 返回 true， 人 和 否则 返回 


false。 


7. Set4xMsaaState: 开启 或 禁用 4X MSAA 功 能 


8. Run: 这 个 方法 封装 了 应 用 程序 的 消息 循环 。 它 使 用 的 是 Win32 
的 PeekMessage 函 数 ， 当 没有 窗口 消息 到 来 时 就 会 处 理 我 们 的 游戏 逻辑 
部 分 。 该 方法 的 实现 可 见 4.4.3 节 。 


9. InitMainwindow: 初始 化 应 用 程序 主 窗口 。 本 书 假 设 读者 熟悉 
基本 的 Win32 窗 口 初始 化 流程 。 





10. InitDirect3D: 通过 实现 4.3 节 中 讨论 的 步骤 来 完成 Direct3D 
的 初始 化 。 


11. CreateSwapChain: 创建 交换 链 〈 参 见 4.3.5 节 ) 。 


12. CreateCommandobjects: 依 4.3.4 节 中 所 述 的 流程 创建 命令 队 
列 、 命 令 列 表 分 配器 和 命令 列表 。 


13. FlushCommandQueue: 强制 CPU 等 待 GPU， 直 到 GPU 处 理 完 
队列 中 所 有 的 命令 〈 详 见 4.2.2 节 ) 。 


14. CurrentBackBuffer: 返回 交换 链 中 当前 后 台 绥 冲 区 的 
ID3D12Resource。 


15. CurrentBackBufferView: 返回 当前 后 台 组 冲 区 的 RTV ( 演 
染 目标 视图 ，render target view) 。 


16. DepthstencilView: 返回 主 深度 /模板 缓冲 区 的 DSV 深度/ 
模板 视图 ，depth/stencil view) 。 


17. CalculateFrameStats: 计算 每 秒 的 平均 帧 数 以 及 每 帧 平均 
的 毫秒 时 长 。 实 现 方法 将 在 4.5.4 节 中 讨论 。 





18. LogAdapters: 枚 举 系统 中 所 有 的 适配器 (参见 4.1.10 节 ) 。 


19. LogAdapterOutputs: 枚 举 指定 适配器 的 全 部 显示 输出 ( 参 
见 4.1.10 节 ) 。 


20. LogOutputDisplayModes: 枚 举 某 个 显示 输出 对 特定 格式 支 
持 的 所 有 显示 模式 (参见 4.1.10 节 )。 


4.5.3 ”框架 方法 


对 于 本 书 的 所 有 示例 程序 来 说 ， 我 们 每 次 都 会 重 写 D3DApp 中 的 6 个 
虚 函 数 。 这 6 个 函数 用 于 针对 特定 的 示例 来 实现 所 需 的 具体 功能 。 这 种 
设 定 的 好 处 是 把 初始 化 代码 、 消 奶 处 理 等 流程 都 统一 实现 在 D3DApp 类 
中 ， 继 而 使 我 们 可 以 把 精力 集中 在 特定 例 程 中 的 关键 代码 之 上 。 以 下 是 
对 这 6 个 框架 方法 的 概述 


1. Initialize: 通过 此 方法 为 程序 编写 初始 化 代码 ， 例 如 分 配 资 
源 、 初 始 化 对 象 和 建立 3D 场 景 等 。D3DApp 类 实现 的 初始 化 方法 会 调 
用 InitMainwindow 和 InitDirect3D， 因 此 ， 我 们 在 自己 实现 的 初始 
化 派生 方法 中 ， 应 当 首 先 像 下 面 那 样 来 调用 D3DApp 类 中 的 初始 化 方 
法 : 


bool TestApp: :Initialize() 


if(!D3DApp: :Initialize ()) 
return false; 

















/* 其 他 的 初始 化 代码 请 置 于 此 */ 
} 











这 样 一 来 ， 我 们 的 初始 化 代码 才能 访问 到 D3DApp 类 中 的 初始 化 成 
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2. MsgProc: 该 方法 用 于 实现 应 用 程序 主 窗口 的 窗口 过 程 函数 
(procedure function〉。 一 般 来 说 ， 如 果 需 要 人 处理 在 D3DApp: :MsgProc 
中 没有 得 到 处 理 ( 或 者 不 能 如 我 们 所 愿 进行 处 理 ) 的 消 轧 ， 只 要 重 写 此 
方法 即 可 。 访 方法 的 实现 在 4.5.5 节 中 有 相应 的 讲解 。 此 外 ， 如 果 对 该 方 
法 进行 了 重 写 ， 那 么 其 中 并 未 处 理 的 消息 都 应 当 转 交 至 
D3DApp: :MsgProc。 








3. CreateRtvAndDsvDescriptorHeaps: 此 虚 函 数 用 于 创建 应 用 
程序 押 需 的 RTV 和 DSV 描 述 符 扒 。 默 认 的 实现 是 创建 一 个 含 
有 SwapChainBufferCount 个 RTV 摘 述 符 的 RTV 推 〈 为 交换 链 中 的 绥 冲 
区 而 创建 》 ， 以 及 具有 一 个 DSV 摘 述 符 的 DSV 推 〈 为 深度 /模板 缓冲 区 
而 创建 》 。 访 方法 的 默认 实现 足以 满足 大 多 数 的 示例 ， 但 是 ， 为 了 使 用 
多 演 染 目标 Cmultiple render targets) 这 种 高 级 技术 ， 届 时 仍 将 重 写 此 方 
二 


4. OnResize: 当 D3DApp: :MsgProc 函 数 接收 到 NM_SIZE 消 息 时 便 
会 调用 此 方法 。 吞 窗口 的 大 小 发 生 了 改变 ， 一 些 与 工作 区 大 小 有 关 的 
Direct3D 属 性 也 需要 随 之 调整 。 特 别 是 后 人 台 缓 冲 区 以 及 深度 /模板 缓冲 











区 ， 为 了 [匹配 窗口 工作 区 调整 后 的 大 小 需要 对 其 重新 创建 。 我 们 可 以 通 
过 调用 IDXGISwapChain: :ResizeBuffers 方 法 来 调整 后 台 绥 冲 区 的 尺 
寸 。 对 于 深度 /模板 绥 冲 区 而 言 ， 则 需要 在 销毁 后 根据 新 的 工作 区 大 小 
进行 重建 。 另 外 ， 演 染 目 标 和 深度 /模板 的 视 网 也 应 重新 创建 。D3DApp 
类 中 OnResize 方 法 实现 的 功能 即 为 调整 后 台 绥 冲 区 和 深度 /模板 绥 冲 区 
的 尺寸 ， 我 们 可 直接 碍 阅 其 源 代 码 来 研究 相关 细节 。 除 了 这 些 缓冲 区 以 
外 ， 依 赖 于 工作 区 大 小 的 其 他 属性 〈 如 投影 矩阵 ，projection matrix) 也 
要 在 此 做 相应 的 修改 。 由 于 在 调整 窗口 大 小 时 ， 客 户 端 代码 可 能 还 需 执 
行 一 些 它 自己 的 逻辑 代码 ， 因 此 该 方法 亦 属 于 框架 的 一 部 分 。 





5. Update: 在 绘制 每 一 帧 时 都 会 调用 该 抽象 方法 ， 我 们 通过 它 来 
随 着 时 间 的 推移 而 更 新 3D 应 用 程序 (如 呈现 动画 、 移 动 摄像 机 、 做 碰 
撞 检 测 以 及 检查 用 户 的 输入 等 ) 。 


6. Draw: 在 绘制 每 一 帧 时 都 会 调用 的 抽象 方法 。 我 们 在 该 方法 中 
发 出 泻 染 命令 ， 将 当前 帧 真正 地 绘制 到 后 台 缓 冲 区 中 。 当 完成 帧 的 绘制 
后 ， 再 调用 IDXGISwapChain: :Present 方 法 将 后 台 绥 冲 区 的 内 容 显示 
在 屏幕 上 。 


注音 Note > 


除了 上 述 6 个 框架 方法 之 外 ， 我 们 为 了 便于 人 处理 鼠标 的 按 下 、 释 放 
和 移动 事件 ， 还 分 别提 供 了 3 个 相关 的 虚 函 数 : 


virtual void OnMouseDown(WNPARAM btnState, int x, int y){ } 


virtual void OnMouseUp(WPARAM btnState, int x, int y) { } 
virtual void OnMouseMove(WPARAM btnState, int x, int y){ } 








如 此 一 来 ， 大 希望 处 理 鼠 标 消 奶 ， 我 们 只 需 重 写 这 儿 种 方法 ， 而 不 
必 重 写 MsgProc 方 法 。 这 3 个 处 理 鼠 标 消 朋 方法 的 第 一 个 参数 都 
征 NPARAM， 它 存储 了 鼠标 按键 的 状态 《〈 即 鼠标 事件 发 生 时 ， 哪 个 键 被 
按 下 ) 。 第 二 个 和 第 三 个 参数 则 表示 鼠标 指针 在 工作 区 的 坐标 (z, 急 。 





4.5.4” 申 的 统计 信息 


游戏 和 图 形 应 用 程序 往往 都 会 测量 每 秒 演 染 的 帧 数 〈frames per 

second，FPS) 作为 一 种 画面 流畅 度 的 标杆 。 为 此 ， 我 们 仅 需 统计 在 特 
定时 段 1 内 所 处 理 的 帧 数 〈 并 将 帧 数 存 于 变量 z 中 ) 即 可 。 因 此 ， 时 段 ! 内 
的 平均 FPS 值 即 为 1fPsavyg = n/t。 如 果 设 t = 1， 那 么 fPsavg 二 n/1 王 nn。 在 
我 们 的 代码 中 ， 实 际 所 用 的 时 段 就 是 上 = 1〈 秒 ) ， 这 样 做 可 省 去 一 次 除 
法 运算 。 再 者 ， 用 1 秒 为 限 会 取 到 一 个 比较 合理 的 平均 值 一 一 这 段 时 间 
不 长 不 短 ， 刚 好 合适 。D3DApp: :CalculateFrameStats 方 法 提供 了 计 
算 FPS 的 相关 代码 : 














void D3DApp::CalculateFrameStats() 





// 这 段 代 码 计 算 了 每 秒 的 平均 帧 数 ， 也 计算 了 每 帧 的 平均 泻 染 时 间 
// 这 些 统计 值 都 会 被 附加 到 窗口 的 标题 栏 中 





static int frameCnt = ©; 
static float timeElapsed = 08.6f; 


frameCnt++; 


// 以 1 秒 为 统计 周期 来 计算 平均 帧 数 以 及 每 帧 的 平均 泻 染 时 间 
if( (mTimer.TotalTime() - timeElapsed) >= 1.6f ) 
{ 
float fps = (float)frameCnt; // fps = frameCnt / 1 
float mspf = 16060.6f / fps; 




















wstring fpsstr = to wstring(fps); 
wstring mspfStr = to wstring(mspf); 


wstring windowText = mMainWndCaption + 
L"” fps: " + fpsStr + 
L” mspf: ”+ mspfStr; 
SetWindowText(mhMainwnd，windowText.c_str()); 














// 为 计算 下 一 组 平均 值 而 重 置 








frameCnt = 0 
timeElapsed += 1.6f; 





为 了 统计 帧 数 ， 在 每 一 帧 中 都 要 调用 此 方法 。 


除了 计算 FPS 外 ， 以 上 代码 也 统计 了 泻 染 一 帧 所 花费 的 平均 时 间 
《以 野 秒 计 ) : 


float mspf = 1666.6f / fps; 


每 帧 所 花费 的 秒 数 即 FPS 的 倒数 ， 我 们 可 通过 将 此 倒数 乘 以 1000 ms 
/1 s 来 把 单位 从 秒 转换 到 写 秒 (1s 为 1000ms) 。 











这 一 行 代码 的 意思 是 计算 泻 染 一 帧 画面 所 花费 的 至 秒 数 ， 这 是 一 种 
与 FPS 和 截然 不 同 的 统计 量 〈 但 是 此 值 可 由 FPS 推 导出 来 ) 。 事 实 上 ， 知 
道 演 染 一 帧 所 花费 的 时 间 要 比 了 解 FPS 更 为 有 效 ， 因 为 随 着 场景 的 转 
换 ， 我 们 通过 前 者 就 能 二 观 地 看 出 每 一 帧 泻 染 时 长 的 增 减 。 而 FPS 却 不 








能 在 场景 改变 后 立即 反映 出 泻 染 时 间 的 变化 。 此 外 ， 正 如 [Dunlop03] 在 
《FPS versus Frame Time (FPS vs. 帧 时 间 〉 》 一 文中 所 指出 的 ， 由 于 
FPS 曲 线 图 (FPS curve) 的 非 线性 特征 ， 使 得 采用 FPS 进 行 分 析 可 能 会 
得 到 误导 性 的 结果 。 例 如 ， 请 考虑 场景 (一 ) : 假设 我 们 的 应 用 程序 跑 
到 了 1000 FPS， 利 用 1 ms〈 坚 秒 〉 就 可 以 泻 染 1 帧 。 那 么 ， 当 帧 率 降 到 
了 250 FPS 时 ， 演 染 1 帧 就 要 用 4 ms。 现 在 再 来 思考 情景 (二 ) : 设想 我 
们 的 应 用 程序 跑 到 100 FPS， 花 10 ms 泻 染 1 帧 。 如 果 帧 率 降 到 了 76.9 
FPS， 那 么 渲染 1 帧 将 花费 约 13 ms。 这 两 种 情景 中 每 帧 的 泻 染 时 间 都 增 
加 了 3 ms， 也 就 表示 它们 在 演 染 每 一 帧 的 过 程 中 都 增加 了 同样 多 的 时 
间 。 然 而 ，FPS 所 反映 出 的 统计 值 却 并 不 直观 。 虽 然 从 1000 FPS 跌 到 250 
FPS 看 起 来 要 比 从 100 FPS 下 降 到 76.9 FPS 的 幅度 大 得 多 ， 但 诚 如 我 们 所 
看 到 的 ， 它 们 演 染 每 帧 所 增加 的 时 间 实 际 上 却 是 相同 的 。 





4.5.5 消息 处 理 函 数 





我 们 对 应 用 程序 框架 中 的 窗口 过 程 进行 了 大 量 的 简化 工作 。 在 一 般 
情况 下 ， 本 书 的 程序 并 不 会 过 多 地 涉及 Win32 消 轧 。 事 实 上 ， 应 用 程序 
的 核心 代码 都 是 在 空闲 处 理 期 间 《〈 即 没有 窗口 消息 可 处 理 时 ) 执行 的 。 
但 是 ， 仍 有 一 些 重要 的 消息 需要 我 们 杀 目 去 处 理 。 鉴 于 窗口 过 程 代 码 的 
篇 幅 ， 我 们 并 不 打算 将 所 有 的 代码 都 罗列 于 此 ， 而 是 仅 解释 处 理 这 些 消 
县 背后 的 动机 。 由 于 应 用 框 如 是 本 书 所 有 示例 的 基石 ， 所 以 我 们 或 励 读 
者 下 载 其 源 代码 文件 ， 并 人 花费 些 时 间 来 熟悉 它 。 





我 们 要 处 理 的 第 一 个 消息 是 NM_ACTIVATE。 当 一 个 程序 被 激活 


(Cactivate) 或 进入 非 活 动 状态 (deactivate〉 时 便 会 发 送 此 消息 。 我 们 以 
下 列 方式 来 对 它 进行 处 理 : 


case WM ACTIVATE: 
if( LOWORD(wParam) == WA _INACTIVE ) 
{ 
mAppPaused = true; 
mTimer.Stop(); 


else 

{ 
mAppPaused = false; 
mTimer.Start(); 





return 0; 


如 您 所 见 ， 当 程序 变 为 非 活动 状态 时 ， 我 们 会 将 数据 成 
员 mAppPaused 设 置 为 true， 而 当 程 序 被 激活 时 ， 则 把 数据 成 
员 mAppPaused 设 置 为 false。 男 外 ， 当 暂停 使 用 应 用 程序 时 ， 我 们 就 
停止 计时 器 ， 一 旦 程序 被 再 次 激活 ， 再 令 计时 器 继续 工作 。 如 果 回 
顾 D3DApp: :Run 〈4.4.3 节 ) 的 实现 ， 我 们 会 发 现 : 当 程 序 暂 停 时 ， 将 不 
会 再 执行 后 续 更 新 场景 的 代码 ， 而 是 把 空闲 出 来 的 CPU 周期 返还 给 操作 
系统 。 这 样 一 来 ， 我 们 的 程序 就 不 会 在 非 活动 的 状态 中 占用 CPU 资源 
J 


下 一 个 要 处 理 的 消息 是 NM_SIZE。 前 文 兽 提 到 过 ， 当 用 户 调整 窗口 
的 大 小 时 便 会 产生 此 消息 。 处 理 这 个 消息 的 主要 目的 是 : 我 们 希望 使 后 
台 缓 冲 区 和 深度 /模板 缓冲 区 的 大 小 与 工作 区 算 形 范围 的 大 小 保持 一 致 
《从 而 使 图 像 不 会 发 生 拉 伸 的 现象 ) 。 所 以 ， 在 每 一 次 调整 窗口 大 小 的 
时 候 ， 我 们 都 要 记 住 改 变 缓冲 区 的 尺寸 。 调 整 缓冲 区 尺 才 的 代码 实现 于 








D3DApp: :OnResize 方 法 之 中 。 正 如 前 文中 所 述 ， 调 

用 IDXGISwapChain: :ResizeBuffers 方 法 即 可 改变 后 台 绥 冲 区 的 尺 
寸 。 而 深度 /模板 缓冲 区 则 需要 在 销毁 之 后 ， 根 据 新 的 窗口 尺寸 来 重新 
创建 。 此 外 ， 演 染 目 标 和 深度 /模板 的 视图 也 需 随 之 重建 。 对 于 用 户 拖 
动 调整 栏 的 操作 ， 我 们 一 定 要 小 心 对 待 ， 因 为 这 个 行为 会 连续 发 出 
NM_SIZE 消 息 ， 但 我 们 不 希望 随 之 连续 调整 缓冲 区 。 因 此 ， 如 知 确 定 用 
户 正在 拖 动 边框 调整 窗口 大 小 ， 我 们 理应 什么 也 不 做 〈 和 暂停 应 用 程序 除 
外 ) ， 直 到 用 户 完成 调整 操作 后 再 执行 修改 缓冲 区 等 操作 。 通 过 处 

理 WM_EXITSIZEMOVE 消 息 就 可 以 实现 这 一 点 。 这 条 消息 会 在 用 户 释 放 
调整 栏 时 发 送 。 





// 当 用 户 抓 取 调 整 栏 时 发 送 WM_ENTERSIZEMOVE 消 息 
case WM ENTERSIZEMOVE: 

mAppPaused = true; 

mResizing = true; 

mTimer.Stop(); 

return 0; 





// 当 用 户 释 放 调 整 栏 时 发 送 WM_EXITSIZEMOVE 消 息 











// 此 处 将 根据 新 的 窗口 大 小 重 置 相关 对 象 〈 如 缓冲 区 
case WM EXITSIZEMOVE: 

mAppPaused = false; 

mResizing = false; 

mTimer.Start(); 
OnResize(); 

return 0; 

















下 面 3 个 消息 的 处 理 过 程 比较 简单 ， 我 们 直接 来 看 代码 : 








// 当 窗 口 被 销毁 时 发 送 NM_DESTROY 消 息 











case WM_DESTROY : 
PostQuitMessage(6) ; 
return 6 


























// 当 某 一 菜单 处 于 激活 状态 ， 而 且 用 户 按 下 的 既 不 是 助 记 键 (mnemonic key) 也 不 是 加 速 











键 
// (acceleratorkey) 时 ， 就 发 送 NM_MENUCHAR 消 息 
case WM_MENUCHAR : 
// 当 按 下 组 合 键 alt-enter 时 不 发 出 beep 蜂 鸣 声 
return MAKELRESULT(8，MNC_CLOSE ) ; 

















// 捕获 此 消息 以 防 窗口 变 得 过 小 

case WM GETMINMAXINFO: 
( (MINMAXINFO*)lParam)->ptMinTrackSize.x 
((MINMAXINFO*)lParam)->ptMinTrackSize.y 
return 0; 








266; 
266; 





最 后 ， 为 了 在 代码 中 调用 我 们 自己 编写 的 鼠标 输入 虚 函 数 ， 要 按 以 
下 方式 来 处 理 与 鼠标 有 关 的 消 奶 : 


case WM LBUTTONDOWN: 

case WM MBUTTONDOWN: 

case WM RBUTTONDOWN: 
OnMouseDown (wParam, GET X LPARAM(lParam), GET_Y_LPARAM(lParam)); 
return 0; 

case WM LBUTTONUP: 

case WM MBUTTONUP: 


case WM RBUTTONUP: 


OnMouseUp(wParam, GET Xx LPARAM(lParam), GET_Y_ LPARAM(1lParam)); 
return 0; 

case WM MOUSEMOVE: 
OnMouseMove (wParam, GET X LPARAM(lParam), GET_Y_LPARAM(lParam)); 
return 0; 





为 了 使 用 GET_X_LPARAM 和 GET_Y_LPARAM 两 个 宏 ， 我 们 必须 引 


入 #include <Windowsx.h>。 


4.5.6 ”初始 化 Direct3D 演 示 程 序 


应 用 框架 已 经 讨论 完毕 ， 现 在 就 让 我 们 用 它 来 实现 一 个 小 程序 。 在 
这 个 程序 中 ， 我 们 基本 不 用 去 做 什么 ， 因 为 父 类 D3DApp 几 乎 蔡 我 们 完 


成 了 所 有 的 工作 。 在 这 里 ， 我 们 的 主要 任务 是 从 D3DApp 中 派生 出 自己 
的 类 ， 实 现 框架 函数 并 在 此 为 示例 编写 特定 的 代码 。 本 书 的 所 有 程序 都 
将 这 循 下 面 的 模板 。 





#include "../../Common/d3dApp.h" 
#include <DirectXColors.h> 


using namespace DirectX; 


class InitDirect3DApp : public D3DApp 

{ 

public: 
InitDirect3DApp (HINSTANCE hInstance); 
~InNitDirect3DApp(); 


virtual bool Initialize()override; 


private: 
virtual void OnResize()override; 
virtual void Update(const GameTimer& gt)override; 
virtual void Draw(const GameTimer& gt)override; 


}; 


int WINAPI WinMain(HINSTANCE hInstance, HINSTANCE prevInstance， 
PSTR cmdLine, int showCmd) 





{ 
// 为 调试 版 本 开启 运行 时 内 存 检测 ， 方 便 监督 内 存 泄露 的 情 ; 
#if defined(DEBUG) | defined(_DEBUG) 
_CrtSetDbgFlag( _CRTDBG ALLOC MEM DF | _CRTDBG LEAK CHECK_DF ); 
#endif 


沼 





try 
{ 
InitDirect3DApp theApp(hInstance); 
if(!theApp.Initialize()) 
return 0; 


return theApp.Run(); 


} 
catch(DxException& e) 


{ 
MessageBox(nullptr, e.ToString().c_str(), L"HR Failed", MB_OK); 


return 0; 


} 


} 


InitDirect3DApp: :InitDirect3DApp(HINSTANCE hInstance) 
: D3DApp (hInstance) 


{ 
} 
InitDirect3DApp: :~InitDirect3DApp() 


{ 
} 


bool InitDirect3DApp::Initialize() 


{ 
if(!D3DApp: :Initialize()) 
return false; 


return true; 


} 


void InitDirect3DApp: :OnResize() 


{ 
D3DApp: :OnResize(); 


} 


void InitDirect3DApp: :Update(const GameTimer& gt) 


{ 
} 


void InitDirect3DApp: :Draw(const GameTimer& gt) 


{ 
// 重复 使 用 记录 命令 的 相关 内 存 
// 只 有 当 与 GPU 关联 的 命令 列表 执行 完成 时 ， 我 们 才能 将 其 重 置 
ThrowIfFailed(mDirectCmdListAlloc->Reset()); 



































// 在 通过 ExecuteCommandList 方 法 将 某 个 命令 列表 加 入 命令 队列 后 ， 我 们 便 可 以 重 置 该 
命令 列表 。 以 
// 此 来 复 用 命令 列表 及 其 内 存 
ThrowIfFailed(mCommandList->Reset( 
mDirectCmdListAlloc.Get(), nullptr)); 



































// 对 资源 的 状态 进行 转换 ， 将 资源 从 呈现 状态 转换 为 泻 染 目标 状态 
mCommandList->ResourceBarrier( 
1, &CD3DX12 RESOURCE BARRIER::Transition( 
CurrentBackBuffer(), 
D3D12 RESOURCE STATE_ PRESENT, 
D3D12_RESOURCE STATE_RENDER TARGET)); 











// 设置 视 口 和 裁剪 矩形 。 它 们 需要 随 着 命令 列表 的 重 置 而 重 置 

















mCommandList->RSSetViewports(1, &mScreenViewport); 
mCommandList->RSSetScissorRects(1, &mScissorRect); 





// 清除 后 台 组 冲 区 和 深度 缓冲 区 

mCommandList->ClearRenderTargetView( 
CurrentBackBufferView()， 
Colors::LightSsteelBlue，6，nullptr); 

mCommandList->ClearDepthStencilView( 
DepthstencilView(), D3D12 CLEAR FLAG DEPTH | 
D3D12_CLEAR FLAG STENCIL, 1.6f, 0, 60, nullptr); 








// 指定 将 要 演 染 的 缓冲 区 
mCommandList->OMSetRenderTargets(1, &CurrentBackBufferView(), 
true, &DepthStencilView()); 














// 再 次 对 资源 状态 进行 转换 ， 将 资源 从 泻 染 目标 状态 转换 回 呈 珊 
mCommandList->ResourceBarrier( 
1, &CD3DX12 RESOURCE BARRIER::Transition( 
CurrentBackBuffer(), 
D3D12 RESOURCE_ STATE RENDER_TARGET, 
D3D12_RESOURCE_ STATE_PRESENT)); 





// 完成 命令 的 记录 
ThrowIfFailed(mCommandList->Close()); 





// 将 待 执 行 的 命令 列表 加 入 命令 队列 
ID3D12CommandList* cmdsLists[] = { mCommandList.Get() }; 
mCommandQueue->ExecuteCommandLists( countof(cmdsLists), cmdsLists); 


// 交换 后 台 绥 冲 区 和 前 台 组 冲 区 
ThrowIfFailed(mSwapChain->Present(6, 08)); 
mCurrBackBuffer = (mCurrBackBuffer + 1) % SwapChainBufferCount; 











// 等 待 此 帧 的 命令 执行 完毕 。 当 前 的 实现 没有 什么 效率 ， 也 过 于 简单 
// 我 们 在 后 面 将 重新 组 织 泻 染 部 分 的 代码 ， 以 免 在 每 一 帧 都 要 等 待 






































FlushCommandQueue( ) ; 





其 中 的 一 些 方法 我 们 还 没有 讨论 过 。ClearRenderTargetView 方 
法 会 将 指定 的 泻 染 目 标清 理 为 给 定 的 颜色 ，ClearDepthstencilView 
方法 则 用 于 清理 指定 的 深度 /模板 绥 冲 区 。 在 每 帧 为 了 刷新 场景 而 开始 
绘制 之 前 ， 我 们 总 是 要 清除 后 台 绥 冲 区 泻 染 目 标 和 深度 /模板 绥 冲 区 。 

















这 两 个 方法 的 声明 如 下 。 


void ID3D12GraphicsCommandList: :ClearRenderTargetView( 
D3D12_CPU_DESCRIPTOR_HANDLE RenderTargetView， 
const FLOAT ColorRGBA[ 4 ]， 


UINT NumRects, 
const D3D12 RECT *pRects); 





1. RenderTargetView: 竺 清除 的 资源 RTV。 








2. ColorRGBA: 定义 即将 为 泻 染 目标 填充 的 颜色 。 


3. NumRects: pRects 数 组 中 的 元 素数 量 。 此 值 可 以 为 0。 





4. pRects: 一 个 D3D12_RECT 类 型 的 数组 ， 指 定 了 演 染 目标 将 要 
被 清除 的 多 个 矩形 区 域 。 若 设 定 此 参数 为 nullptr， 则 表示 清除 整个 泻 
染 目 标 。 





void ID3D12GraphicsCommandList::ClearDepthStencilView( 
D3D12 CPU _ DESCRIPTOR HANDLE DepthStencilView, 
D3D12 CLEAR FLAGS ClearFlags, 
FLOAT Depth, 


UINT8 Stencil, 
UINT NumRects， 
const D3D12 RECT *pRects); 





1. DepthstencilView: 待 清除 的 深度 /模板 绥 冲 区 DSV。 


2. ClearFlags: 该 标志 用 于 指定 即将 清除 的 是 深度 缓冲 区 还 是 模 
板 缓冲 区 。 我 们 可 以 将 此 参数 设置 为 D3D12_CLEAR_FLAG_DEPTH 
或 D3D12_CLEAR_FLAG_STENCIL， 也 可 以 用 按 位 或 运算 符 连 接 两 者 ， 表 
示 同 时 清除 这 两 种 缓冲 区 。 


3. Depth: 以 此 值 来 清除 深度 绥 冲 区 。 


4. Stencil: 以 此 值 来 清除 模板 绥 冲 区 。 





5. NumRects: pRects 数 组 内 的 元 素数 量 。 可 以 将 此 值 设 置 为 0。 


6. pRects: 一 个 D3D12_RECT 类 型 的 数组 ， 用 以 指定 资源 视图 将 
要 被 清除 的 多 个 矩形 区 域 。 将 此 值 设 置 为 nwll1ptr， 则 表示 清除 整个 泻 
染 目 标 。 


另 一 个 新 出 现 的 方法 
是 ID3D12GraphicsCommandList: :0OMSetRenderTargets， 通 过 此 方 
法 即 可 设置 我 们 希望 在 演 染 流水 线 上 使 用 的 演 染 目标 和 深度 /模板 缓冲 
区 。《 到 目前 为 止 ， 我 们 仅 是 把 当前 的 后 台 绥 冲 区 作为 演 染 目标 ， 并 只 
设置 了 一 个 主 深 度 /模板 缓冲 区 。 但 在 本 书 的 后 续 章 节 里 ， 我 们 还 将 运 
用 多 演 染 目标 技术 ) 。 此 方法 的 原型 如 下 。 


void ID3D12GraphicsCommandList::OMSetRenderTargets( 
UINT NumRenderTargetDescriptors， 


const D3D12 CPU_DESCRIPTOR HANDLE *pRenderTargetDescriptors, 
BOOL RTsSingleHandleToDescriptorRange, 
const D3D12 CPU DESCRIPTOR HANDLE *pDepthStencilDescriptor); 





1. NumRenderTargetDescriptors: 待 绑 定 的 RTV 数量 ， 
即 pRenderTargetDescriptors 数 组 中 的 元 素 个 数 。 在 使 用 多 演 染 目标 
这 种 高 级 技术 时 会 涉及 此 参数 。 就 目前 来 说 ， 我 们 总 是 使 用 一 个 RTV。 


2. pRenderTargetDescriptors: 指向 RTV 数组 的 指针 ， 用 于 指 
定 我 们 希望 绑 定 到 演 染 流水 线 上 的 泻 染 目标 。 


3. RTsSingleHandleToDescriptorRange: 如 果 
pRenderTargetDescriptors 数 组 中 的 所 有 RTV 对 象 在 描述 符 堆 中 都 是 
连续 存放 的 ， 就 将 此 值 设 为 true， 人 否则 设 为 false。 





4. pDepthstencilDescriptor: 指向 一 个 DSV 的 指针 ， 用 于 指定 
我 们 和 希望 绑 定 到 泻 染 流水 线 上 的 深度 /模板 绥 冲 区 。 





最 后 要 通过 IDXGISwapChain: :Present 方 法 来 交换 前 、 后 台 组 冲 
区 。 与 此 同时 ， 我 们 也 必须 对 索引 进行 更 新 ， 使 之 一 直 指 向 交换 后 的 当 
前 后 台 绥 冲 区 。 这 样 一 来 ， 我 们 才 可 以 正确 地 将 下 一 帧 场景 泻 染 到 新 的 
后 台 绥 冲 区 。 


ThrowIfFailed(mSwapChain->Present(96，6) ); 
mCurrBackBuffer = (mCurrBackBuffer + 1) % SwapChainBufferCount ; 
图 4.12 所 示 的 是 本 章 例 程 的 效果 。 

















图 4.12 ”本 章 例 程 的 效果 


4.6 ”调试 Direct3D 应 用 程序 4] 


大 多 数 的 Direct3D 函 数 会 返回 HRESULT 错 误 码 。 我 们 的 示例 程序 实 
则 采用 简单 的 错误 处 理 机 制 来 检测 返回 的 HRESULT 值 。 如 果 检 测 失败 ， 
则 抛 出 异常 ， 显 示 调 用 出 错 的 错误 码 、 函 数 名 、 文 件 名 以 及 发 生 错误 的 
行 号 。 这 些 操作 具体 由 d3dUtil.h 中 的 代码 实现 : 


class DxException 
{ 
public: 
DxException() = default; 
DxException(HRESULT hr, const std::wstring& functionName, 
const std::wstring& filename, int lineNumber); 


std: :wstring ToString()const; 


HRESULT ErrorCode = S_OK; 
std: :wstring FunctionName; 
std: :wstring Filename; 

int LineNumber = -1; 


}; 


#ifndef ThrowIfFailed 
#define ThrowIfFailed(x) \ 
{\ 
HRESULT hr = (x); \ 
std: :wstring wfn = AnsiToWString( FILE ); \ 
if(FAILED(hr )) { throw DxException(hr , L#x, wfn, _ LINE ); } \ 


} 
#endif 





不 难看 出 ThrowIfFailed 必 定 是 一 个 宏 ， 而 不 是 一 个 函数 ;若非 如 
此 ， ”FILE 和 LINE 将 定位 到 ThrowIfFailed 所 在 的 文件 与 行 ， 
而 非 出 错 函 数 的 文件 与 行 。 


L#x 会 将 宏 ThrowIfFailed 的 参数 转换 为 Unicode 字 符 串 。 这 样 一 
来 ， 我 们 就 能 将 函数 调用 所 产生 的 错误 信息 输出 到 消息 框 当 中 。 


对 于 Direct3D 函 数 返回 的 HRESULT 值 ， 我 们 是 这 样 使 用 宏 对 其 进行 
检测 的 的 71， 


ThrowIfFailed(md3dDevice->CreateCommittedResource( 
&CD3DX12_HEAP_PROPERTIES(D3D12_HEAP_TYPE_DEFAULT) ， 
D3D12_HEAP_FLAG NONE, 


&depthStencilDesc, 

D3D12 RESOURCE_ STATE _ COMMON, 

&optClear， 

IID_ PPV_ARGS(mDepthStencilBuffer.GetAddressOof()))); 





整个 程序 逻辑 都 位 于 一 个 try/catch 块 之 中 : 


try 


{ 
InitDirect3DApp theApp(hInstance); 


if(!theApp.Initialize()) 
return 0; 


return theApp.Run(); 


catch(DxException& e) 
{ 


MessageBox(nullptr, e.ToString().c_str(), L"HR Failed", MB_OK); 
return 6 


} 





如 果 返 回 的 HRESULT 是 个 错误 值 ， 则 抛 出 异常 ， 通 过 Mes sageBox 
函数 输出 相关 信息 ， 并 退出 程序 。 例 如 ， 在 
癌 CreateCommittedResource 方 法 传递 了 一 个 无 效 参数 时 ， 我 们 便 会 
看 到 图 4.13 所 示 的 消息 框 。 





md3dDevice-> CreateCommittedResource( 
&CD3D12_HEAP_PROPERTIES(D3D12_HEAP. Ba eh 
D3D12_ HEAP_MISC_NONE &depthStencilDesc, 
D3D12_RESOURCE_USAGE_INITIAL 
lID_PPV_ARGS(mDepthStencilBuffer, eters failed in 


“\"\Common\d3dApp.cpp; line 220 error: The parameter is incorrect. 








图 4.13” 当 返回 的 HRESULT 是 个 错误 码 时 ， 会 弹出 消息 框 并 显示 类 似 的 错误 信息 


4.7 小 结 





1. 可 以 把 Direct3D 看 作 是 一 种 介 于 程序 员 和 图 形 人 硬件 之 间 的 “ 桥 
梁 ”。 借 此 ， 程 序 员 便 可 以 通过 调用 Direct3D 函 数 来 实现 把 资源 视图 绑 定 
到 硬件 泻 染 流水 线 、 配 置 泻 染 流水 线 的 输出 以 及 绘制 3D 几 何 体 等 操 
作 。 


2. 组 件 对 象 模型 (COM) 是 一 种 可 以 令 DirectX 不 依赖 于 特定 语言 
且 回 后 兼容 的 技术 。Direct3D 程 序 员 不 需 知 道 COM 的 具体 实现 细节 ， 也 
无 需 了 解 其 工作 原理 ， 只 需 知晓 如 何 获取 和 释放 COM 接 口 即 可 。 


3. 1D、2D、3D 纹 理 分 别 类 似 于 由 数据 元 素 所 构成 的 D、2D、3D 
数组 。 纹 理 元 素 的 格式 必定 为 DXGI_FORMAT 枚 举 类 型 中 的 成 员 之 一 。 除 
了 第 见 的 图 像 数 据 ， 纹 理 也 能 存储 像 深度 信息 等 其 他 类 型 的 数据 (如 深 
度 缓冲 区 就 是 一 种 存储 深度 值 的 纹理 ) 。GPU 可 以 对 纹理 进行 特殊 的 操 
作 ， 比 如 运用 过 滤器 和 进行 多 重 采 样 。 





4. 为 了 避免 动画 中 发 生 闪 烁 的 问题 ， 最 好 将 动画 帧 完全 绘制 到 一 
种 称 为 后 台 绥 冲 区 的 离 屏 纹理 中 。 只 要 依 此 行事 ， 显 示 在 屏幕 上 的 就 会 
是 一 个 完整 的 动画 帧 ， 观 者 也 就 不 会 察觉 到 帧 的 绘制 过 程 。 当 动画 帧 被 
绘制 在 后 人 台 绥 冲 区 后 ， 前 台 组 冲 区 与 后 台 绥 冲 区 的 角色 也 就 该 互 换 了 : 
为 了 显示 下 一 帧 动画 ， 此 前 的 后 人 台 组 冲 区 将 变 为 前 台 绥 冲 区 ， 而 此 前 的 
前 人 台 绥 冲 区 亦 会 变 成 后 台 绥 冲 区 。 后 台 和 前 台 绥 冲 区 交换 角色 的 行为 称 
为 呈现 〈present) 。 前 人 台 和 后 台 绥 冲 区 构成 了 交换 链 ， 在 代码 中 通过 





IDXGISwapChain 接 口 来 表示 。 使 用 两 个 缓冲 区 《前 台 和 后 人 台 ) 的 情况 
称 作 双 缓冲 。 





5. 假设 场景 中 有 一 些 不 透明 的 物体 ， 那 么 离 摄像 机 最 近 的 物体 上 
的 点 便 会 让 挡住 它 后 面 一 切 物体 上 的 对 应 点 。 深 度 绥 冲 就 是 一 种 用 于 确 
定 在 场景 中 离 摄像 机 最 近 点 的 技术 。 通 过 这 种 技术 ， 我 们 就 不 必 再 担心 
场景 中 物体 的 绘制 顺序 了 。 








6. 在 Direct3D 中 ， 资 源 不 能 直接 与 泻 染 流水 线 相 绑 定 。 为 此 ， 我 
们 需要 为 绘制 调用 时 所 引用 的 资源 指定 描述 符 。 我 们 可 将 描述 符 对 象 看 
作 是 GPU 识别 以 及 描述 资源 的 一 种 轻 量 级 结构 体 。 而 且 ， 我 们 还 可 以 为 
同一 种 资源 创建 不 同 的 描述 符 。 如 此 一 来 ， 一 种 资源 就 可 以 具有 多 种 用 
途 。 例 如 ， 我 们 可 以 借 此 将 同一 种 资源 绑 定 到 演 染 流水 线 的 不 同 阶段 ， 
或 者 用 不 同 的 DXGI_FORMAT 成 员 将 它 摘 述 为 不 同 的 格式 。 应 用 程序 可 通 
过 创建 描述 符 堆 来 为 描述 符 分 配 所 需 的 内 存 。 


7. ID3D12Device 是 Direct3D 中 最 重要 的 接口 ， 我 们 可 以 把 它 看 作 
是 图 形 硬件 设备 的 软件 控制 器 。 我 们 能 够 通过 它 来 创建 GPU 资源 以 及 其 
他 用 于 控制 图 形 硬 件 的 特定 接口 。 


8. 每 个 GPU 中 都 至 少 有 一 个 命令 队列 。CPU 可 通过 Direct3D API 用 
令 列 表 癌 该 队列 提交 命令 ， 而 这 些 命令 则 指挥 GPU 执行 某 些 操作 。 在 
令 没 有 到 达 队 列 首部 以 前 ， 用 户 所 提交 的 命令 是 无 法 被 执行 的 。 如 果 
今 
全 


全 

中 
全 
9 
全 
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队列 内 为 衬 ， 则 GPU 会 因为 没有 任务 要 去 处 理 而 处 于 空闲 状态 ;但 
奉命 令 队 列 被 装 得 太 满 ， 则 CPU 将 在 茶 个 时 刻 因 提 交 命 令 的 速度 退 上 


五 


GPU 执行 命令 的 速度 而 进入 空闲 状态 。 值 得 一 提 的 是 ， 这 两 种 情景 其 实 
都 没有 充分 地 利用 系统 资源 。 





9. GPU 是 系统 中 与 CPU 一 起 并 行 工作 的 第 二 种 处 理 器 。 有 时 ， 我 
们 需要 对 CPU 与 GPU 进行 同步 。 例 如 ， 知 GPU 命令 队列 中 有 一 条 引用 某 
资源 的 命令 ， 那 么 在 GPU 完成 此 命令 的 处 理 之 前 ，CPU 就 不 能 修改 或 销 
毁 这 一 资源 。 任 何 同步 方法 都 会 导致 其 中 的 一 种 处 理 器 处 于 一 段 等 待 和 
空 亲 的 状态 ， 这 意味 着 两 种 处 理 器 并 没有 被 充分 利用 ， 因 此 ， 我 们 应 尽 
量 减 少 同步 的 次 数 ， 并 缩短 同步 的 时 间 。 


10. 性 能 计数 器 是 一 种 高 精度 的 计时 器 ， 它 是 测量 微小 时 间 差 的 一 
种 有 效 工 具 。 例 如 ， 我 们 可 以 用 它 来 测量 两 帧 之 间 的 间隔 时 间 。 人 性 能 计 
时 器 使 用 的 时 间 单 位 称 为 计数 
(count) 。QueryPerformanceFrequency 函 数 输出 的 是 性 能 计时 器 每 
秒 的 计数 ， 可 用 它 将 计数 单位 转换 为 秒 。 性 能 计时 器 的 当前 时 间 值 (以 
计数 为 单位 测量 ) 可 用 QueryPerformanceCounter 函 数 获得 。 





11. 通过 统计 时 间 段 At 内 处 理 的 帧 数 即 可 计算 出 每 秒 的 平均 帧 数 
CFPS) 。 设 n 为 时 间 At 内 处 理 的 帧 数 ， 那 么 该 时 间 段 内 每 秒 的 平均 帧 
数 为 PSowg = "At。 采 用 帧 率 进行 考量 可 能 会 对 性 能 造成 一 些 误 判 ， 
相对 而 言 ,“ 处 理 一 帧 所 花费 时 间 ” 这 个 统计 信息 可 能 更 加 精准 、 直 观 。 
以 秒 为 单位 表示 的 每 帧 平均 处 理 时 间 可 以 用 帧 率 的 倒数 来 计算 ， 即 


1/F PSovg, 








12. 示例 框架 为 本 书 的 全 部 例 程 都 提供 了 统一 的 接口 。d3dUtil.h、 


d3dUtil.cpp、d3dApp.h 和 d3dApp.cpp 文 件 封 装 了 所 有 应 用 程序 必须 实现 
的 标准 初始 化 代码 。 封 装 这 些 代码 便 隐 藏 了 相关 的 细节 ， 这 样 的 话 ， 我 
们 就 可 以 将 精力 集中 在 不 同 示例 的 特定 主题 之 上 。 


.为 了 开启 调试 模式 需要 启用 调试 层 (debugController- 
>EnableDebugLayer() ) 。 如 此 一 来 ，Direct3D 就 会 把 调试 信息 发 往 
VC++ 的 输出 窗口 。 








[1 即 render target， 简 单 来 讲 ， we 染 场 景 而 将 像素 绘 
制 到 的 特定 缓冲 区 (buffer) 。 通 稼 是 占用 部 分 显存 的 后 台 缓 冲 区 ， 以 
及 纹理 〈 详 见 后 文 ) 。 


[2] 在 预览 版 中 ， 此 函数 

为 ID3D12CommandList::ClearRenderTargetView。 在 正式 版 中 ， 预 
览 版 ID3D12CommandList 接 口 下 的 函数 基本 移 至 
ID3D12GraphicsCommandList 接 口 下 。 





[3] _ pixel， 构 成 图 像 的 基本 元 素 。 从 图 形 角度 来 讲 ， 可 认为 像素 是 一 种 
图 像 的 采样 单位 (将 图 像 以 像素 为 基础 进行 划分 ， 再 于 像素 中 进行 采 

样 ) 。 因 此 ， 两 张 同样 大 小 的 图 片 ， 分 辩 紊 蝇 者 ， 意 味 厦 像 系 数量 越 

多 ， 细 市 越 丰 富 ， 男 面 束 越 清晰 。 由 于 实际 显示 上 的 原因 (后 面 注释 会 
提 到 ) ， 也 赋予 了 像素 “大 小 ”的 概念 。 在 Direct3D 中 ， 像 素 被 抽象 为 具 
有 一 定 长 宽 的 色 块 。 














[4] 关于 mipmap 的 相关 知识 可 参见 9.5.2 节 。 





[5] 屏幕 等 显示 设备 采用 的 是 rgb 色彩 空间 ， 为 了 区 分 美术 中 的 传统 三 
原色 《〈 红 黄 赣 ) 在 此 称 红 绿 赣 为 三 基色 。 知 要 了 解 其 他 色彩 空间 ， 请 参 
考 其 他 文献 。 


[6] 原文 为 reinterpret cast， 其 实在 这 里 翻译 为 重新 解释 数据 类 型 更 受 。 
但 考虑 到 C++ 语 言 术语 了 予以 保留 。 














[7] 感 兴趣 的 读者 可 以 查看 “三 重 绥 冲 ”与 “垂直 同步 "的 有 关 知 识 。 


[8] 人 至 于 二 者 是 人 否 需要 区 分 ， 具 体 还 要 看 应 用 场景 。 比 如 谈 到 像素 与 纹 
素 的 映射 天 系 时 ， 必 须 将 这 两 个 概念 子 以 区 分 。 文 中 谈 到 的 基本 上 是 约 
定 俗 成 的 叫 法 。 


[9] 即 sampling， 也 作 取 样 ， 本 是 信号 处 理 方面 的 术语 。 在 本 书 中 ， 可 
认为 该 操作 是 以 特定 的 模式 ， 从 连续 的 图 像 数 据 中 采集 出 离散 的 关键 颜 
色 信息 。 








[10] 即 不 同 广 商 所 生产 的 显示 器 《甚至 同一 厂商 不 同型 号 的 显示 器 ) 
屏幕 中 的 像 系 都 会 有 特定 的 形状 、 大 小 以 及 数量 ， 这 取决 于 其 子 像 素 
(subpixel) 的 形状 、 大 小 乃至 排列 顺序 。 因 此 ， 导 致 直线 实际 上 是 由 
数量 有 限 、 离 散 而 非 连续 的 “点 ?构成 ， 继 而 造成 其 "阶梯 ? 状 的 锯齿 交 
应 。 注 意 ， 在 这 段 注解 里 所 说 的 硬件 显示 设备 上 的 “ 像 系 "， 有 面积 、 形 
状 ， 而 “ 子 像素 ” 则 是 实现 人 硬件 像素 三 基色 通道 的 基本 单位 ， 即 一 个 “ 子 
像素 ”表达 一 个 疝 色 通道 。 请 勿 与 正文 中 的 术语 混 清 。 




















[11] 前 文 注释 中 曾 提 到 ， 其 实 是 提升 了 单位 面积 上 的 像素 数量 ， 从 


而 “缩小 "了 像素 的 大 小 。 


[12] 文中 出 现 的 “ 子 像素 (subpixel) ”是 指 在 像素 内 部 再 次 细 分 出 的 小 
像素 ， 用 以 采样 。 


[13] 除了 文中 这 两 种 常见 的 反 锯 上 从 (anti-aliasing) 手段 ， 还 有 许多 以 
不 同方 式 实 现 的 反 饮 齿 技 术 ， 有 兴趣 的 读者 可 以 自行 研究 。 


[14] 若是 黑白 印刷 ， 则 文中 的 “绿色 ? 即 深 灰色 ,，“ 浅 绿色 ?为 浅 灰色 ， 
白色 则 表示 该 像素 保持 之 前 的 颜色 。 


[15] Windows 10 在 1607 版 、1703 版 与 1709 版 分 别 引 入 了 
ID3D12Device 接 口 的 新 版 本 ID3D12Device1、ID3D12Device2 

与 ID3D12Device3。 官 方 文档 建议 用 户 ， 在 1607 至 1703 版 本 的 操作 系统 
上 采用 ID3D12Device1 接 口 ， 在 1703 至 1709 版 本 的 操作 系统 上 采 

用 ID3D12Device2 接 口 ， 在 1769 及 其 后 续 版 本 的 操作 系统 上 使 

用 ID3D12Device3 接 口 ( 虽 然 这 样 做 的 人 并 不 多 ， 甚 至 包括 官方 示例 。 
想 用 新 功能 的 读者 倒 可 以 试 一 试 ) 。 查 阅 对 应 文档 便 可 知 每 次 

向 ID3D12Device 接 口 添加 的 新 功能 。 








[16] 作者 在 前 文 也 曾 写 到 ， 在 写作 此 书 时 采用 的 是 预览 版 SDK， 但 它 
与 正式 版 SDK 中 的 少量 API 以 及 枚 举 项 却 有 细微 差别 。 微 软 官方 现在 对 
早期 文档 都 标 有 “preliminary” 字 样 ， 但 在 撰写 此 脚注 的 时 候 有 些 正式 版 
文档 的 个 别 细节 仍 未 完全 修正 。 在 此 ， 将 文中 预览 版 的 API 均 修正 为 当 
前 的 正式 版 ， 并 在 第 一 次 出 现时 以 注解 形式 给 出 预览 版 的 原 API， 算 是 
对 DirectX 12 历 史 的 见证 吧 ~ 人 代码 中 的 枚 举 类 型 


D3D12_MULTISAMPLE_QUALITY_LEVEL_FLAGS 在 预览 版 中 
为 D3D12_MULTISAMPLE_QUALITY _LEVELS_FLAG。 


[17] 此 处 描述 不 准确 。Direct3D 12 并 不 支持 创建 MSAA 交 换 链 ! 


[18] 同 理 ， 当 前 Direct3D 12 的 对 应 版 本 
有 D3D_FEATURE_LEVEL_12 6、D3D_FEATURE_LEVEL_12 1。 





[19] 扫描 式 显 示 设 备 的 工作 方式 有 两 种 : 逐 行 扫描 与 隅 行 扫描 。 试 
想 ， 将 显示 设备 的 屏幕 划分 为 多 个 行 ， 称 之 为 " 场 (field) ”， 奇 数 行 称 
为 奇数 场 (upper field) ， 人 偶数 行 则 称 为 偶数 场 (lower field) 。 顾 名 思 
义 ， 逐 行 扫描 即 在 显示 每 一 帧 画面 时 都 从 上 至 下 逐个 场 连续 扫 朱 。 但 根 
据 人 眼 的 视觉 暂 留 效应 ， 便 可 以 每 帧 仅 扫 描 一 种 场 ， 交 蔡 扫 拉 。 








[20] GPU memory， 也 有 直译 作 GPU 内 存 等 。 显 卡通 常 是 一 块 带 有 
PCIe 总 线 接口 的 物理 电路 (这 里 仅 谈 独立 显卡 ) ，GPU 较 之 于 显卡 的 地 
位 大 致 相当 于 CPU 较 之 于 主板 。 相 应 的 ，GPU 控 制 的 显存 基本 相当 于 
CPU 控制 的 内 存 ， 而 后 者 在 本 书 中 也 常 被 称 为 系统 内 存 (system 
memory) 。CPU 内 部 有 多 级 绥 存 与 寄存 器 ， 分 别 用 于 缓存 指令 与 控制 
CPU; GPU 内 部 亦 有 绥 存 与 寄存 器 ， 分 别 用 于 绥 存 纹理 、 绥 存 着 色 占 指 
令 等 以 及 控制 GPU。 有 的 文献 在 划分 GPU 的 组 成 结构 时 ， 会 把 GPU 的 寄 
存 器 及 其 控制 的 内 存 统称 为 GPU memory (GPU 存储 器 ) 。 


[21] 像 书 中 给 出 的 这 类 地 址 ， 完 全 可 以 通过 搜索 神秘 代码 上 车 ， 比 如 
这 里 的 mt186622。 


[22] 相对 于 Direct3D 12 而 言 ，Direct3D 11 支 持 两 种 绘制 方式 ， 即 立即 
演 染 (immediate rendering， 利 用 immediate context 实 现 ) 以 及 延迟 演 染 

(deferred rendering， 利 用 deferred context 实 现 ) 。 前 者 将 绥 冲 区 中 的 命 
令 直接 借 驱 动 层 发 往 GPU 执 行 ， 后 者 则 与 本 文中 介绍 的 命令 列表 模型 相 
似 《〈 但 执行 命令 列表 时 仍然 要 依赖 immediate context) 。 前 者 延续 了 
Direct3D 11 之 前 一 贯 的 绘制 方式 ， 而 后 者 则 为 Direct3D 11 中 新 添加 的 给 
制 方式 。 到 了 Direct3D 12 便 取消 了 立即 演 染 方式 ， 完 全 采用 “命令 列表 - 
> 命令 队列 ”模型 ， 使 多 个 命令 列表 同时 记录 命令 ， 借 此 充分 发 挥 多 核心 
处 理 器 的 性 能 。 可 见 ，Direct3D 11 在 绘制 方面 乃 承 上 启 下 之 势 ， 而 
Direct3D 12 则 进行 了 彻底 的 革新 。 








[23] Windows 10 在 1703 版 与 1709 版 分 别 引 入 了 
ID3D12GraphicsCommandList 接 口 的 新 版 本 ID3D12Graphics- 
CommandList1 与 ID3D12GraphicsCommandList2。 官 方 文 档 建 议 用 户 
在 1703 至 1709 版 本 的 操作 系统 上 采用 ID3D12GraphicsCommandList1 
接口 ， 在 1769 及 其 后 续 版 本 的 操作 系统 上 使 

用 ID3D12GraphicsCommandList2 接 口 (虽然 这 么 做 的 人 不 多 ， 甚 至 
包括 官方 示例 。 但 想 用 新 功能 的 读者 倒 可 以 试 一 试 ) 。 查 阅 对 应 文档 便 
可 了 解 每 次 同 该 接口 添加 的 新 功能 。 








[24] 除了 本 书 文中 介绍 的 这 两 种 命令 列表 类 型 之 外 ， 还 有 如 
D3D12 COMMAND_LIST_TYPE_COMPUTE 〈 仅 接收 与 通用 计算 有 关 的 命 
令 ) 以 及 D3D12_COMMAND_LIST_TYPE_COPY (只 接收 与 复制 操作 相关 


的 命令 ) 等 类 型 。 


[25] bundle 是 种 二 级 命令 列表 ， 可 将 它 看 作 是 一 组 状态 和 命令 的 集 
合 ， 把 它 多 次 挂靠 在 命令 列表 上 即 可 对 其 进行 复 用 。 





[26] Windows 10 在 1709 版 引入 了 ID3D12Fence 接 口 的 新 版 

本 ID3D12Fence1。 官 方 文档 建议 用 户 在 自 1709 版 本 的 操作 系统 上 采 
用 ID3D12Fencel 接 口 。 查 阅 对 应 文档 便 可 了 解 向 该 接口 添加 的 新 功 
能 。 读 者 可 对 此 加 以 党 试 。 





[27] ID3D12CommandQueue: :Signal 方 法 从 GPU 端 设置 围栏 值 ， 
而 ID3D12Fence: :Signal 方 法 则 从 CPU 端 设 置 围栏 值 。 


[28] 在 Direct3D 11 中 ， 这 些 工作 全 权 交 由 驱动 来 管理 ， 因 此 性 能 会 和 
差 。〈 在 Direct3D 12 中 资源 状态 靠 手 动 进行 转换 。 就 此 而 言 ， 应 该 就 不 
需要 驱动 层 介入 资源 状态 的 跟踪 了 。 但 是 作者 说 “ 仍 有 一 个 资源 状态 跟 
踪 系 统 "， 查 询 之 下 似乎 只 有 调试 层 (debug layer) 才 有 这 个 用 来 查 错 

的 “追踪 系统 ”， 文 中 说 法 有 待考 证 ) 。 





[29] 预览 版 里 D3D12_RESOURCE_BARRIER 结 构 体 的 名 称 
为 D3D12_RESOURCE_BARRIER_DESC。 


[30] 己 更 名 为 D3D12Multithreading， 可 在 微软 官方 示例 中 找到 。 


[31] 简单 来 讲 ， 在 操作 系统 中 的 显卡 不 能 发 挥 效 用 等 情况 〈 详 见 文 
档 》 ，WARP 便 会 挺身 而 出 。 可 将 它 当 作 一 个 不 依赖 于 任何 硬件 图 形 适 
配器 的 纯 软 件 演 染 器 。 根 据 wikipeida 给 出 的 信息 ，Windows 10 上 的 
WARP 版 本 可 文 持 的 最 高 功能 级 别 为 feature level 12_1。 但 到 现在 为 止 ， 


微软 的 官方 网 站 并 未 更 新 WARP 的 相关 文档 。 


[32] 前 文 注释 曾 提 到 : Direct3D 12 并 不 支持 创建 MSAA 交 换 链 ， 因 此 
也 就 不 能 在 运行 时 改动 交换 链 的 MSAA 参 数 ! 





[33] 伪 代 码 : 目标 描述 符 句 柄 = 
GetCPUDescriptorHandleForHeapStart() + mCurrBackBuffer * 


mRtvDescriptorSize.。 


[34] ID3D12Resource 接 口 将 物理 内 存 与 堆 资 源 抽象 组 织 为 可 处 理 的 
数据 数组 与 多 维 数据 ， 从 而 使 CPU 与 GPU 可 以 对 这 些 资源 进行 读 写 。 


[35] 在 预览 版 里 此 结构 体 中 D3D12_RESOURCE_FLAGS 名 
为 D3D12_RESOURCE_MISC_FLAG。 


[36] 在 早期 版 本 里 此 项 似乎 多 次 更 名 ， 如 
D3D12_RESOURCE_MISC_ALLOW_DEPTH_STENCIL、D3D12_RESOURCE_M 
有 笔 误 的 可 能 ) 。 


[37] 预览 版 中 D3D12_CPU_PAGE_PROPERTY 的 名 称 
为 D3D12_CPU_PAGE_PROPERTIES。 


[38] 在 预览 版 中 ， 结 构 体 D3D12_HEAP_FLAGS 及 其 成 
员 D3D12_HEAP_FLAG_NONE 的 名 称 分别 为 DB3D12_HEAP_MISC_FLAG 
与 D3D12 HEAP_MISC_NONE。 


[39] 在 预览 版 中 ， 结 构 体 D3D12_RESOURCE_STATES 名 


为 D3D12_RESOURCE_USAGE， 而 深度 /模板 缓冲 区 的 状态 也 不 像 当 前 分 
为 _READ 与 _NRITE 读 写 两 种 ， 仅 为 D3D12_RESOURCE_USAGE_DEPTH 一 
种 状态 。 至 于 资源 初始 状态 也 不 是 D3D12_RESOURCE_STATE_COMMON， 
而 是 D3D12_RESOURCE_USAGE_INITIAL 。 


[40] 从 字面 意思 上 可 得 出 视 口 坐标 所 采用 的 坐标 系 ， 即 以 缓冲 区 左上 
角 为 原点 ，zZ、 8% 轴 的 正方 向 分 别 为 水 平 同 右 与 垂直 癌 下 。 另 外 视 口 坐标 
最 小 值 D3D12_VIEWPORT_BOUNDS_MIN 为 -32768， 不 妨 取 负 值 试 一 试 效 
果 如 何 。 








[41] 根据 文档 来 看 ，Direct3D 12 内 封装 了 一 组 对 应 的 API， 见 
《Timing》 (dn903946) 。 











[42] 这 上 段 对 日 在 当前 的 文档 中 已 经 看 不 到 了 ， 可 以 从 别处 的 文献 中 看 
到 蛛丝马迹 。 原 文 为 : “On a multiprocessor computer it should not matter 
which processor is called. However, you can get different results on different 
processors due to bugs in the basic input/output system (BIOS) or the 


hardware abstraction layer (HAL).” 


[43] 这 段 代 码 注释 得 比较 混乱 ， 其 中 的 停止 〈stop) 与 暂停 〈pause) 
意义 相同 。 


[44] 参见 本 书 附录 A。 


[45] 个 人 感 党 除了 “ 宽 高 比 ? 这 一 译 法 都 有 误导 嫌疑 ， 即 在 大 多 数 场合 
都 应 为 “ 模 同 尺寸 /纵向 尺寸 ”。 


[46] PIX 重 现 江湖 。 详 见 《Introducing PIX on Windows (beta)》 一 文 及 
其 后 续 博 客 文 章 。 男 外 ， 较 新 版 本 的 visual studio 已 经 集成 了 较 强 大 的 图 
形 诊断 调试 工具 ， 详 见 《 调 试 应 用 程序 (Debugging Applications) 》 

(mt243869) 下 的 《调试 GPU 代码 (Debugging GPU Code) 》 

(hh873126) 与 《图 形 诊 断 〈 调 试 DirectX 图 形 ) (Graphics Diagnostics 
(Debugging DirectX Graphics)) 》 〈hh315751) 。 玩 一 玩 这 几 样 工具 会 
对 演 染 流水 线 有 直观 印象 。 另 有 gpuview， 借 此 可 观察 到 GPU 与 CPU 之 
间 的 通信 过 程 ， 乃 至 驱动 向 GPU 人 硬件 队列 发 送 命令 等 工作 法， 加 深 同 步 
方面 的 理解 。 








[47] 在 预览 版 中 ，CD3DX12_HEAP_PROPERTIES 名 

为 CD3D12_HEAP_PROPERTIES， 而 且 DirectX 12 辅 助 结 构 体 的 前 级 大 多 

已 由 CD3D12 变 更 为 CD3DX12。 由 于 Windows 10 的 更 新 策略 相对 于 以 往 

有 了 改变 ， 因 此 读者 也 应 当 注 意 具 体系 统 版 本 对 DirectX 12 的 更 新 
(New Releases, mt748631) 。 


本 章 要 探讨 的 主题 是 演 染 流水 线 山 (rendering pipeline) 。 如 果 给 
出 一 人 台 具 有 确定 位 置 和 旨 癌 的 虚拟 摄像 机 《〈virtual camera) 以 及 某 个 3D 
场景 的 几何 描述 ， 那 么 泻 染 流水 线 则 是 以 此 虚拟 摄像 机 为 视角 进行 观 
察 ， 并 据 此 生成 给 定 3D 场 景 2D 图 像 的 一 整套 处 理 步骤 〈 见 图 5.1) 。 本 
章 的 内 容 更 偏 于 理论 一 一 而 下 一 章 会 用 Direct3D 将 理论 付 诸 实 践 。 在 讲 
解 演 染 流水 线 之 前 ， 先 要 花费 些 时 间 解 决 两 个 问题 ， 首 先 要 讨论 的 是 
3D 视 觉 要 系 《〈 即 通过 局 乎 的 2D 显 示 喜 屏幕 却 能 观察 到 3D 立 体 场景 的 视 
ea 并 在 
Direct3D 代 码 中 加 以 实现 。 





学 习 目 标 : 





1. 了 解 用 于 在 2D 图 像 中 表现 出 场景 立体 感 和 空间 深度 感 等 真实 效 
果 的 关键 因素 。 


2. 探索 如 何 用 Direct3D 表 示 3D 对 象 。 
3. 学 习 怎 样 建立 虚拟 摄像 机 。 


4. 理解 渲染 流水 线 一 一 根据 给 定 3D 场 景 的 几何 描述 ， 生 成 其 2D 图 
像 的 流程 。 
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图 5.1 左 侧 的 图 例 展示 了 一 台 具 有 特定 位 置 和 朝向 的 虚拟 摄像 机 ， 以 及 置 于 3D 场 景 中 一 些 物 体 
的 侧 视图 。 中 间 的 图 例 演示 了 同样 的 场景 ， 但 采用 的 是 由 上 至 下 的 俯视 视角 。 其 中 的 “四 楼 

锥 ”圈定 的 是 观察 者 通过 摄像 机 所 看 到 的 空间 范围 ， 而 位 于 此 四 棱锥 之 外 的 物体 (或 部 分 物 
体 ) 则 是 观察 者 所 看 不 到 的 。 右 侧 的 图 例 展 示 即 为 观察 者 通过 摄像 机 所 看 到 的 2D 图 像 




















5.1 3D 视 党 即 错 和 党? 


在 开局 3D 计 算 机 图 形 学 的 旅程 之 前 ， 还 有 一 个 尚 符 解 诀 的 简单 问 
题 摆 在 我 们 眼前 : 应 怎样 将 3D 场 景 的 空间 深度 感 和 立体 感 在 2D 平 面 显 
示 噩 的 屏幕 中 表现 出 来 呢 ? 幸运 的 是 ， 前 人 早已 深入 地 研究 过 这 个 问题 
了 ， 毕 竟 亏 术 家 们 在 2D 画 布 上 创作 3D 艺 术 作 品 的 历史 已 持续 了 几 个 世 
纪 。 在 本 市 中 ， 我 们 将 探讨 几 种 使 图 像 在 2D 平 徊 上 “立体 ”起 来 的 关键 技 
巧 。 


假设 我 们 看 到 一 段 笔直 的 铁轨 ， 它 癌 远 方 绢 延 ， 望 不 到 尽头 。 铁 路 
的 双轨 虽然 互相 平行 ， 但 是 ， 当 我 们 站 在 铁路 中 央 癌 远 处 张望 时 就 会 发 
现 : 两 条 铁轨 随 着 距离 的 增加 在 逐渐 靠近 ， 甚 至 在 无 限 远 处 相交 了 。 这 
其 实 是 人 类 视觉 系统 的 一 个 特性 : 即 从 观察 效果 上 看 ， 平 行 线 最 终 会 相 
交 于 消失 点 (vanishing point， 又 称 灭 点 ) ， 如 图 5.2 所 示 。 











消失 点 














图 5.2 平行 线 在 视觉 上 终 会 汇 于 消失 点 。 
艺术 家 常 称 之 为 线性 透视 (inear perspective， 亦 有 译作 线条 透视 ) 

















通过 对 人 眼 观 察 物体 的 过 程 进行 简单 的 考察 不 难得 出 以 下 结论 : 随 
着 (z 方 辐 ) 深度 的 增加 ， 物 体会 显得 越 来 越 小 ， 这 也 惑 是 我 们 党 说 
的 “ 近 大 远 小 >。 例如 ， 远 山上 的 房子 看 起 来 很 小 ， 而 离 我 们 较 近 的 小 树 
相对 而 言 看 起 来 反而 较 大 。 图 5.3 展 现 了 这 样 一 幅 简 易 的 场景 : 两 排 平 
行 的 石柱 相对 而 并 。 石 柱 的 尺寸 本 完全 相同 ， 但 随 着 癌 远 处 推进 ， 它 们 
看 起 来 一 个 比 一 个 小 。 我 们 还 可 以 发 现 ， 这 两 排 石柱 最 后 也 将 相交 于 地 
平 线 上 的 消失 后 。 














我 们 都 知道 物体 重 奢 (object overlap〉 的 概念 ， 即 不 透明 物体 能 
遮挡 住 其 后 侧 物体 的 局 部 《或 整体 ) ， 如 图 5.4 所 示 。 这 是 一 个 重要 的 
概念 ， 它 传达 了 不 同 物体 在 场景 中 的 深度 顺序 关系 。 而 我 们 在 第 4 章 中 
也 已 经 讨论 过 如 何在 Direct3D 中 借助 深度 缓冲 区 来 确定 那些 应 当 受 到 遮 
向 而 不 是 绘制 出 来 的 像素 。 





图 5.3 ”图 中 所 有 的 石柱 本 大 小 相同 ， 但 观察 者 看 到 的 效果 却 是 石柱 随 距 离 的 增加 而 逐渐 变 小 





图 5.4 一 组 由 于 前 后 位 置 关系 而 彼此 距 挡 的 物体 〈 这 便 是 具有 重 登 关系 的 物体 ) 


我 们 把 目光 再 转向 图 5.5。 图 的 左 侧 古 一 个 不 受 光 照 的 球体 ， 而 右 
侧 是 一 个 被 区 照射 的 球体 。 我 们 能 明显 地 察觉 到 : 左边 的 球体 看 起 来 版 
为 平坦 ， 丝 坚 没 有 立体 感 一 一 可 能 它 甚 至 都 不 是 球体 ， 而 仅 是 一 个 2D 
圆 片 而 已 ! 所 以 ， 光 照 和 阴影 的 处 理 在 刻画 3D 物 体 的 实体 办 形状 和 立体 
感 中 扮演 着 至 关 重 要 的 角色 。 








最 后 ， 图 5.6 所 示 的 古 一 艘 宇宙 飞船 及 其 阴影 。 阴 影 担负 着 两 个 关 
键 的 任务 。 首 先 ， 它 瞳 示 了 光源 在 场景 中 的 相对 位 置 。 其 次 ， 它 反映 了 
飞船 起 飞 的 大 致 高 度 。 





(a) (b) 


图 5.5 ”光照 对 球体 立体 感 效 果 的 影响 
(a) 不 受 光 照 的 球体 看 上 去 就 是 个 2D 图 形 
(b) 受 光 照射 的 球体 颇具 3D 立 体感 











图 5.6 ”一 艘 宇宙 飞船 及 其 阴影 。 阴 影 不 仅 暗示 着 场景 中 的 光源 位 置 ， 而 且 反 映 了 飞船 离 地 高 度 


这 一 信息 











刚刚 讨论 过 的 种 种 观察 结论 都 是 我 们 日 复 一 日 积累 下 来 的 直观 经 
验 ， 因 此 是 毋庸 置疑 的 。 尽 管 如 此 ， 把 这 些 司空 见 惯 的 规律 总 结 出 来 ， 
并 且 牢 记 于 心 ， 对 我 们 在 3D 计 算 机 图 形 学 上 的 学 习 和 工作 仍 都 是 大 有 
神 益 的 。 


5.2 模型 的 表示 


实际 上 ， 实 体 3D 对 象 是 借助 三 角形 网 格 (triangle mesh) 来 近似 表 
示 的 ， 因 而 我 们 要 以 三 角形 作为 3D 物 体 建 模 的 基石 。 如 图 5.7 所 示 ， 我 
们 能 用 三 角形 网 格 近 似 地 模拟 出 任何 真实 世界 中 的 3D 物 体 。 通 常 来 
讲 ， 模 拟 一 个 物体 所 用 的 三 角形 越 多 ， 那 么 模型 就 与 日 标 物体 越 接 近 ， 
这 是 因为 模型 会 随 之 获得 更 为 丰富 的 细节 。 当 然 ， 建 模 所 用 的 三 角形 越 
多 ， 也 就 需要 更 强大 的 计算 处 理 能 力 ， 所 以 要 根据 应 用 受众 的 硬件 性 能 
做 出 权衡 。 除 了 三 角形 ， 点 和 线 也 有 其 用 武之 地 。 例 如 ， 我 们 可 以 利用 
一 系列 宽度 为 1 像素 的 短线 段 绘制 出 一 条 近似 曲线 。 





图 5.7 一 辆 用 三 角形 网 格 近 似 模拟 出 来 的 小 汽车 和 一 颗 由 三 角形 网 格 近 似 表 示 的 山 骨 头 


看 到 图 5.7 中 使 用 的 大 量 三 角形 ， 又 一 个 问题 逐渐 浮 出 水 面 : 各 要 
手动 列 出 这 些 三 角形 来 模拟 3D 物 体 ， 实 在 是 一 件 太 麻烦 的 事 儿 了 。 除 
了 最 简单 的 模型 ， 我 们 可 以 使 用 一 种 叫 作 3D 建 模 工 具 (3D modeler) 的 
专用 软件 ， 来 生成 和 处 理 复杂 的 3D 对 象 。 在 这 些 建 模 软件 的 可 视 化 交 











互 环 境 里 ， 用 户 可 以 运用 其 中 丰富 的 工具 集 构 建 出 复杂 而 证 有 真实 感 的 
网 格 ， 因 此 ， 这 种 软件 使 整个 建 模 的 流程 要 方便 快捷 得 多 。 在 游戏 开发 
方面 ， 流 行 的 建 模 软件 有 3D Studio Max、LightWave 3D、Maya、 
Softimage|XSI31 和 Blender。 其 中 ，Blender 是 开源 和 免费 爱好 者 的 福音 。 
然而 ， 在 本 书 的 第 一 部 分 中 ， 我 们 仍 将 采用 手动 或 运用 数学 公式 的 方式 
来 生成 3D 对 象 〈 比 如 ， 通 过 参数 方程 就 可 以 方便 地 生成 用 于 模拟 圆柱 
和 球体 的 三 角形 列表 ) ， 在 第 三 部 分 中 ， 我 们 将 展示 如 何 加 载 和 显示 以 
3D 建 模 程 序 生 成 的 3D 模 型 。 

















5.3 计算 机 色彩 基础 


计算 机 显示 器 中 的 每 个 像素 发 出 的 都 是 红 、 绿 、 蓝 三 色 混 合 光 罗 。 
当 混 合 的 光线 进入 观察 者 眼中 ， 照 射 到 视网膜 的 特定 区 域 时 ， 视 锥 细胞 
便 受 到 刺激 产生 神经 冲动 ， 并 通过 视神经 传 至 大 脑 ， 大 脑 继而 解释 传 来 
的 信号 并 感知 颜色 。 因 为 混合 光 的 变化 各 异 ， 细 胞 受到 的 刺激 也 各 不 相 
同 ， 所 以 我 们 就 能 感知 到 颜色 间 的 差异 了 。 图 5.8 上 图 给 出 了 红 、 绿 、 
葛 三 基色 混合 成 不 同 颜 色 的 示例 ， 下 图 展示 的 则 是 不 同 强 度 的 红色 。 通 
过 将 这 3 种 颜色 分 量 按 不 同 强度 的 混合 在 一 起 ， 我 们 便 能 描述 出 显示 真 
实感 图 像 押 需 的 一 切 颜 色 。 

















上 至 Adobe Photoshop 等 各 种 绘图 程序 ， 下 至 Win32 中 的 
ChooseColor〔 选 择 颜 色 〉 对 话 框 〈 见 图 5.9) 都 可 以 作为 初学 者 以 
RGB (red，green，blue， 红 绿 览 ) 值 来 描述 颜色 的 练习 途径 。 在 此 ， 
我 们 可 通过 尝试 不 同 的 RGB 组 合 来 观察 它们 所 混合 (ass 





脱 红 鲜红 


图 5.8 《上 图 ) 红 、 绿 、 蓝 3 种 纯色 混合 所 得 到 的 新 颜色 。 
《下 图 ) 控制 红 光 的 强度 便 可 调配 出 不 同 明度 的 红色 
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图 5.9 ”ChooseColor 对 话 框 


器 所 能 发 出 的 红 、 绿 、 赣 三 色光 的 强度 都 是 有 限 的 。 为 了 


便于 描述 光 的 强度 ， 我 们 党 将 它 量化 为 范围 在 0~~1 归 一 化 区 间 中 的 值 。 





0 代表 无 强度 ，1 则 表示 强度 最 大 ， 处 于 两 者 之 间 的 值 就 表示 对 应 的 中 间 
强度 。 例 如 ， 强 度 值 (0.25, 0.67, 1.0) 就 表明 此 光线 由 强度 为 25% 的 红 
色光 、 强 度 为 67% 的 绿色 光 以 及 强度 为 100% 的 蓝 色光 混合 而 成 。 由 此 例 
可 以 看 出 ， 我 们 能 用 3D 向 量 〈” 9) 来 表示 颜色 ， 其 中 0 < 7,g,b < 1， 
这 3 种 颜色 分 量 分 别 代表 红 、 绿 、 赣 三 色光 在 混合 光 中 的 强度 。 


5.3.1 磊 色 运算 





问 量 的 部 分 运算 规则 在 颜色 回 量 上 同样 适用 。 例 如 ， 我 们 可 以 使 两 
个 颜色 向 量 相 加 来 得 到 新 的 颜色 : 


(0.0, 0.5, 0) + (0, 0.0, 0.25) = (0.0, 0.5, 0.25) 





这 就 是 说 ， 通 过 混合 中 等 强度 的 绿色 和 低 等 强度 的 赣 色 ， 便 会 得 到 
深 绿 色 。 


也 可 以 通过 颜色 回 量 之 间 的 减法 运算 来 获得 新 的 颜色 : 


(1, 1, 1)—(1, 1, 0) = (0, 0, 1) 


由 上 式 可 以 看 出 ， 从 白色 中 去 掉 红 色 和 绿色 的 成 分 ， 便 可 得 到 蓝 
[四 


标量 乘法 也 是 有 效 的 ， 请 考虑 下 式 : 


0.5(1, 1 1) = (0.5, 0.5, 0.5) 


此 式 将 白色 的 各 颜色 分 量 取 半 ， 继 而 得 到 中 等 强度 的 灰色 。 另 外 ， 
可 通过 2(0.25, 0, 0) = (0.5, 0, 0) 运 算 将 红色 分 量 的 强度 加 倍 。 





显而易见 的 是 ， 像 点 积 和 广 积 这 样 的 运算 法 则 就 不 适用 于 闫 色 同 量 
了 。 不 过 ， 颜 色 向 量 也 有 它们 自己 专属 的 颜色 运算 ， 即 分 量 式 
(modulation 或 componentwise 〉 乘法 。 它 的 定义 为 : 





(Cr， Cg Cp) ® (Kk, ky, k,) = (CA cgkg, cpk, ) 
这 种 运算 主要 应 用 于 光照 方程 。 例 如 ， 假 设 有 颜色 为 ("9,8) 的 入 
射 光线 ， 照 射 到 一 个 反射 50% 红 色光 、75% 绿 色光 、25% 蓝 色光 且 吸 收 
剩余 光 的 表面 。 那 么 ， 我 们 残 可 以 据 此 给 出 反射 光线 的 颜色 : 
(7,g,b) ® (0.5, 0.75, 0.25) = (0.57, 0.759, 0.256) 
通过 此 式 即 可 看 出 ， 由 于 此 表面 会 吸收 一 部 分 入 射 光 ， 上 所 以 当 它 照 
射 在 该 平面 上 时 会 损失 掉 部 分 颜色 强度 。 





在 进行 颜色 运算 的 过 程 中 ， 颜 色 分 量 有 可 能 会 超出 [0, 1] 这 个 区 间 。 
如 ， 思 考 (1, 0.1, 0.6) + (0, 0.3, 0.5) = (1, 0.4, 1.1) 这 个 等 式 。 由 于 1.0 代 表 
颜色 分 量 的 最 大 强度 ， 所 以 任何 光 的 强度 都 不 能 超过 此 值 。 因 此 ， 我 们 
就 只 得 将 值 为 1.1 的 强度 与 1.0 这 一 上 限 强度 视 作 等 同 ， 将 1.1 钳 制 
(clamp) 为 1.0。 同 样 地 ， 显 示 右 也 不 能 发 出 强度 为 负 值 的 光 ， 所 以 亦 
应 把 负 的 颜色 分 量 〈 由 减法 运算 所 得 到 的 结果 ) 钳制 为 0.0。 


5.3.2 ” 128 位 颜色 


事实 上 ， 我 们 通常 还 会 用 到 男 一 种 名 为 alpha 分 量 (alpha 
component) 的 颜色 分 量 。alpha 分 量 常用 于 表示 颜色 的 不 透明 度 回 
Copacity。 值 为 0.0 表 示 完 全 透明 ， 值 为 1.0 表 示 不 透明 ) ， 它 在 混合 
Cblending) 技术 《第 10 章 ) 中 起 到 了 至 关 重 要 的 作用 《因为 我 们 目前 
还 用 不 到 混合 技术 ， 所 以 和 暂 将 alpha 分 量 置 为 1) 。 这 就 是 说 ， 把 alpha 分 
量 算 在 内 的 话 ， 我 们 就 可 以 用 4D 向 量 (7,9,4, 外来 表示 每 一 种 颜色 ， 分 量 
需要 满足 0 7,9,8,a < 1。 为 了 用 128 位 〈128bit) 数据 来 表示 一 种 颜 
色 ， 每 个 分 量 都 要 使 用 浮 点 值 。 由 于 每 种 颜色 刚好 能 用 数学 上 的 4D 同 
量 来 表示 ， 所 以 我 们 也 就 能 在 代码 中 用 XMVECTOR 类 型 来 描述 它们 。 在 
通过 DirectXMath 问 量 函 数 来 进行 项 色 运 算 〈 如 颜色 的 加 法 和 运算、 减法 
运算 和 标量 乘法 运算 ) 的 同时 ， 我 们 也 能 借助 SIMD 技 术 加 快 数据 的 处 
速度 。DirectXMath 库 针对 分 量 式 乘法 运算 提供 了 下 列 函 数 : 








XMVECTOR XM_CALLCONV XMColorModulate(  // 返回 c1Rc2 
FXMVECTOR C1, 
FXMVECTOR C2); 


5.3.3 ”32 位 颜色 


为 了 用 32 位 (32bit〉 数 据 表示 一 种 颜色， 每 个 分 量 仅 能 分 配 到 1 个 
字 节 。 因 此 ， 每 个 占用 8 位 字 节 的 颜色 分 量 就 可 以 分 别 描述 256 种 不 同 的 
颜色 强度 一 一 0 代表 无 强度 ，255 是 最 大 强度 ， 处 于 两 者 之 间 的 值 也 就 表 
示 相 应 的 中 间 强 度 。 每 种 颜色 分 量 占 用 空间 虽然 看 起 来 很 小 ， 但 是 它们 
的 全 部 组 合 〈256 x 256 x 256 = 16 777 216) 却 能 表示 出 千 万 种 不 同 的 颜 
色 。DirectXMath 库 (#include &1lt;DirectXPackedVector .hy>) 





在 DirectX: :PackedVector 命 名 空间 中 提供 了 下 面 的 结构 用 于 存储 32 
位 颜色 上 g; 


namespace DirectX 
{ 
namespace PackedVector 
{ 
// ARGB 颜 色 表示 法 ;以 8-8-8-8 位 的 无 符号 归 一 化 整数 分 量 封装 为 一 个 32 位 的 整数 

// 将 alpha、 红 、 绿 、 蓝 4 种 分 量 分 别 用 8 位 无 符号 归 一 化 整数 表示 ， 以 此 封装 32 位 归 一 化 颜 
多 

// alpha 分 量 存 于 最 高 8 位 有 效 位 ， 而 蓝 色 分 量 则 存 于 最 低 8 位 有 效 位 (A8R8G8B8) 

// [32] aaaaaaaa rrrrrrrr gggggggg bbbbbbbb [861][7] 

struct XMCOLOR 


{ 





























union 


{ 


struct 

{ 
uint8 七 bi // Blue: 6/255 to 255/255 
uint8 七 gj // Green: 8/255 to 255/255 
uint8 t r; // Red: 6/255 to 255/255 
uint8 t a; // Alpha: 6/255 to 255/255 

}; 

uint32 t c; 

}; 


XMCOLOR() {} 

XMCOLOR(uint32 t Color) : c(Color) {} 

XMCOLOR(float r, float g, float b, float a); 
explicit XMCOLOR(_In reads (4) const float *pArray); 


operator uint32 t () const { return c; } 


XMCOLOR& operator= (const XMCOLOR& Color) { c = Color.c; return 
*this; } 
XMCOLOR& operator= (const uint32 t Color) { c¢ = Color; return *this; 


} 
}; 
} // PackedVector 命名 空间 结束 
} // DirectX 命名 空间 结束 











通过 将 整数 范围 [0, 255] 映 射 到 实数 区 间 [0, 1]， 就 可 以 将 32 位 颜色 


转换 为 128 位 颜色 ， 具 体 做 法 是 将 每 个 分 量 分 别 除 以 255。 也 就 是 说 ， 如 
果 有 整数 0 < n < 255， 那 么 “ 355 “ 即 为 归 一 化 范围 0 一 1 的 颜色 强 
度 。 例 如 ， 设 有 一 32 位 颜色 (80, 140, 200, 255)， 将 其 转换 成 对 应 的 128 位 
颜色 的 过 程 为 ; 


0 140 200 2 
255 255 255 25 





, 55 
(80, 140, 200, 255) 一 ( 5 SS (0.31, 0.55, 0.78, 1.0) 
)9 





相反 地 ，128 位 颜色 也 可 以 转换 为 32 位 颜色 ， 方 法 是 将 每 个 颜色 向 
量 分 别 乘 以 255， 再 四 舍 五 入 取 整 ， 如 : 


(0.3, 0.6, 0.9, 1.0) 一 (0.3x255.0.6x255.0.9x255.1.0x255) = (77, 153, 230, 255) 


由 于 在 XMCOLOR 中 通常 将 4 个 8 位 颜色 分 量 封装 为 一 个 32 位 整数 值 
(例如 ， 一 个 unsigned int 类 型 的 值 ) ， 因 此 在 32 位 颜色 与 128 位 颜色 
互相 转换 的 过 程 中 常常 需要 进行 一 些 额外 的 位 运算 〈 提 取出 每 个 分 
量 ) 。 对 此 ，DirectXMath 库 中 定义 了 一 个 获取 XMCOLOR 类 型 实例 并 返回 
其 相应 XMVECTOR 类 型 值 的 函数 : 








XMVECTOR XM CALLCONV PackedVector: :XMLoadColor( 
const XMCOLOR* pSource); 


图 5.10 展 示 了 将 4 个 8 位 颜色 分 量 封装 为 UINT(32 位 无 符号 整数 ) 类 
型 的 具体 细节 。 注 意 ， 这 仅 是 封装 颜色 分 量 的 方式 之 一 。 除 了 ARGB 之 
外 ， 还 有 ABGR 以 及 RGBA 这 两 种 格式 ， 只 不 过 XMCOLOR 类 中 使 用 的 格 
式 为 ARGB 而 已 。 男 外 ，DirectXMath 库 还 提供 了 一 个 可 将 XMVECTOR 转 
换 至 XMCOLOR 的 函数 : 


32 位 














图 5.10 32 位 颜色 表示 法 ， 为 alpha、 红 、 绿 、 蓝 4 种 分 量 都 各 分 配 了 1 字 节 








void XM CALLCONV PackedVector: :XMStoreColor( 
XMCOLOR* pDestination, 
FXMVECTOR V); 


一 般 来 说 ，128 位 颜色 值 和 常用 于 高 精度 的 颜色 运算 (例如 位 于 像素 
着 色 器 中 的 各 种 运算 ) 。 在 这 种 情况 下 ， 由 于 运算 所 用 的 精度 较 高 ， 因 
此 可 有 效 降低 计算 过 程 中 所 产生 的 误差 。 但 是 ， 最 终 存 储 在 后 台 绥 冲 区 
中 的 像素 颜色 数据 ， 却 往往 都 是 以 32 位 颜色 值 来 表示 。 而 目前 的 物理 显 
示 设 备 仍 不 足以 充分 发 挥 出 更 高 色彩 分 辨 率 的 优势 [Verth04]。 














5.4” 泻 染 流水 线 概 述 


各 给 出 某 个 3D 场 景 的 几何 描述 ， 并 在 其 中 架设 一 台 上 共有 确定 位 置 
和 绷 癌 的 虚拟 摄像 机 ， 那 么 演 染 沉 水 线 (rendering pipeline) 是 以 此 援 
像 机 为 观察 视角 而 生成 2D 图 像 的 一 系列 完整 步骤 。 图 5.11 左 侧 展 示 的 是 
组 成 泻 染 流水 线 的 所 有 阶段 ， 而 右 侧 则 是 显存 资源 。 从 资源 内 存 池 指 辐 
泻 染 流 水 线 阶段 的 箭头 ， 表 示 该 阶段 可 以 访问 资源 并 以 此 作为 输入 。 例 
如 ， 在 像素 着 色 器 阶段 (pixel shader stage) ， 演 染 流水 线 为 了 完成 用 户 
分 派 的 任务 ， 可 以 从 显存 所 存 的 纹理 资源 中 读 取 数据 。 从 泻 染 流水 线 阶 
段 指 同 内存 的 箭头 ， 则 意味 着 该 阶段 可 以 癌 GPU 资 源 写 入 数据 。 例 如 ， 
在 输出 合并 (器 阶段 ‘output merger stage) 把 数据 写 到 像 后台 绥 冲 区 
和 深度 /模板 缓冲 区 这 样 的 纹理 之 中 。 同 时 也 可 以 看 到 ， 位 于 输出 合并 
阶段 的 箭头 是 双 同 的 〈 说 明 此 阶段 可 读 写 GPU 资 源 ) 。 如 我 们 所 见 ， 大 
多 数 阶段 都 是 不 能 癌 GPU 资 源 进行 写 操作 的 。 事 实 上 ， 演 染 流水 线 中 每 
个 阶段 所 输出 的 数据 往往 都 是 作为 其 下 个 阶段 的 输入 。 例 如 ， 顶 点 着 色 
器 阶段 (vertex shader stage) 从 输入 装配 器 阶段 〈input assembler 
stage) 获得 输入 数据 ， 待 完成 相应 工作 后 ， 再 将 结果 输出 至 几何 着 色 器 
阶段 (geometry shader stage) 。 后 续 的 内 容 将 对 泻 染 流水 线 的 每 个 阶段 
进行 更 加 细致 的 探讨 。 








图 5.11 演 染 流水 线 的 各 个 阶段 


5.5 输入 闭 配 器 阶段 


输入 装配 器 (Input Assembler，IA) 阶段 会 从 显存 中 读 取 几何 数据 
(顶点 和 索引 ，vertex and index) ， 再 将 它们 装配 为 几何 图 元 
(geometric Primitive， 亦 译作 几何 基 元 ， 如 三 角形 和 线条 这 种 构成 图 形 
的 基本 元 素 ) 。 这 些 概念 将 在 后 文中 陆续 介绍 ， 但 简单 来 说， 我 们 是 通 
过 索引 来 定义 如 何 将 项 点 装配 在 一 起 ， 从 而 构成 图 元 的 方法 。 








5.5.1 顶点 


在 数学 中 ， 三 角形 的 顶点 是 两 条 边 的 交点 ; 线段 的 项 点 是 它 的 两 个 
端点 ; 而 对 于 单个 的 点 来 说 ， 它 本 里 就 是 一 个 顶点 。 


图 5.12 所 绘 的 就 是 这 几 种 顶点 。 从 图 示 上 来 看 ， 顶 点 似乎 仅 是 几何 
图 元 中 的 一 种 特殊 点 。 但 是 ， 在 Direct3D 中 ， 顶 点 的 意义 却 不 止 于 此 。 
事实 上 ， 除 空间 位 置 以 外 ，Direct3D 中 的 顶点 还 可 以 包含 其 他 信息 ， 这 
使 我 们 能 够 利用 它 来 表现 出 更 为 复杂 的 泻 染 效果 。 例 如 ， 我 们 将 在 第 8 
章 中 为 顶点 添加 法 问 量 ， 以 实现 光照 效果 。 而 在 第 9 章 中 ， 我 们 则 会 为 
顶点 添加 纹理 坐标 ， 从 而 实现 纹理 贴图 。Direct3D 为 用 户 自 定义 项 点 格 
式 提供 了 很 高 的 灵活 性 〈 即 它 允 许 我 们 定义 顶点 结构 体 中 的 分 量 ) ， 在 
第 6 间 中 我 们 会 讲解 与 之 相关 的 代码 。 届 时 ， 根 据 本 书 中 需要 的 泻 染 效 
朵 ， 我 们 会 依次 定义 儿 种 不 同 的 顶 反 格 式 。 














V1 


po 
Vo 


图 5.12 一 个 由 V0、V1、v2 三 个 顶点 定义 的 三 角形 ; 
一 条 由 顶点 P0、P1 定 义 的 线段 ， 以 及 由 顶点 久 定 义 的 点 


5.5.2 ”图 元 拓扑 


在 Direct3D 中 ， 我 们 要 通过 一 种 名 为 顶点 绥 冲 区 (vertex buffer) 的 
特殊 数据 结构 ， 将 顶点 与 泻 染 流水 线 相 绑 定 。 顶 点 缓冲 区 利用 连续 的 内 
存 来 存储 一 系列 项 点。 可 是 ， 仅 赁 这 一 点 并 不 能 说 明 这 些 顶 点 究竟 如 何 
组 成 几何 图 元 。 例 如 ， 我 们 应 将 顶点 缓冲 区 内 的 顶点 两 两 一 组 解释 成 线 
段 ， 还 是 每 3 个 一 组 解释 为 三 角形 呢 ? 对 此 ， 我 们 要 通过 指定 图 元 拓扑 
《primitive topology， 或 称 基 元 拓扑 〉 来 告知 Direct3D 如 何 用 顶点 数据 来 
表示 几何 图 元 : 

















void ID3D12GraphicsCommandList::IASetPrimitiveTopology( 
D3D_PRIMITIVE_TOPOLOGY PrimitiveTopology ) ; 


typedef enum D3D_PRIMITIVE_TOPOLOGY 

{ 
D3D_PRIMITIVE_TOPOLOGY_UNDEFINED 
D3D_PRIMITIVE_TOPOLOGY_POINTLIST 
D3D_PRIMITIVE_TOPOLOGY_LINELIST = 2， 
D3D_PRIMITIVE_TOPOLOGY_LINESTRIP = 3， 
D3D_PRIMITIVE_TOPOLOGY_TRIANGLELIST = 4， 
D3D_PRIMITIVE_TOPOLOGY_TRIANGLESTRIP = 5， 
D3D_PRIMITIVE_TOPOLOGY_LINELIST ADJ = 16， 
D3D_PRIMITIVE_TOPOLOGY_LINESTRIP_ADJ = 11， 
D3D_PRIMITIVE_TOPOLOGY_TRIANGLELIST_ADJ = 12， 
D3D_PRIMITIVE_TOPOLOGY_TRIANGLESTRIP_ADJ = 13， 
D3D_PRIMITIVE TOPOLOGY_1 CONTROL_POINT_PATCHLIST = 33， 


D3D_PRIMITIVE TOPOLOGY 2 CONTROL POINT_PATCHLIST = 34， 
1 
1 


1 
D3D_PRIMITIVE_TOPOLOGY 32_CONTROL_POINT_PATCHLIST = 64， 
} D3D_PRIMITIVE_ TOPOLOGY; 





在 用 户 通过 命令 列表 (command list) 修改 图 元 拓扑 之 前 ， 所 有 的 
绘制 调用 都 会 治 用 当前 设置 的 图 元 拓扑 方式 。 下 列 代码 演示 的 是 图 元 拓 
扑 的 具体 配置 方法 : 








mCommandList->IASsetPrimitiveTopology( 
D3D_PRIMITIVE TOPOLOGY py 
/* .… 通 过 线 列表 来 绘制 对 象 .. 














mCommandList->IASsetPrimitiveTopology( 
D3D_PRIMITIVE_TOPOLOGY 人 
/* .通过 三 角形 列表 来 绘制 对 象 .. 























mCommandList->IASsetPrimitiveTopology( 
D3D_PRIMITIVE_TOPOLOGY ee 
/* .通过 三 角形 带 来 绘制 对 象 .. 


























接 下 来 ， 我 们 将 陆续 解释 各 种 不 同类 型 的 图 元 拓扑 。 除 了 少数 情况 
以 外 ， 我 们 在 本 书 中 大 多 使 用 三 角形 列表 。 


5.5.2.1 ”点 列表 





通过 枚 举 项 D3D_PRIMITIVE_TOPOLOGY_POINTLIST 来 指定 点 列表 
(point list) 。 当 使 用 点 列表 拓扑 时 ， 所 有 的 顶点 都 将 在 绘制 调用 的 过 
程 中 被 绘制 为 一 个 单独 的 点 ， 如 图 5.13a 所 示 。 


5.5.2.2 ”线条 带 


过 枚 举 项 D3D_PRIMITIVE_TOPOLOGY_LINESTRIP 来 指定 线条 带 


(line strip〉。 在 使 用 线条 带 拓扑 时 ， 顶 点 将 在 绘制 调用 的 过 程 中 被 连 
接 为 一 系列 的 连续 线段 〈 如 图 5.13b 所 示 ) 。 所 以 ， 在 这 种 拓扑 模式 
下 ， 丰 有 7 + 1 个 顶点 就 会 生成 z 条 线段 。 


5.5.2.3” 线 列表 


通过 枚 举 项 D3D_PRIMITIVE_TOPOLOGY_LINELIST 来 指定 线 列 表 
(line list) 。 当 使 用 线 列 表 拓 扑 时 ， 每 对 顶点 在 绘制 调用 的 过 程 中 都 会 
组 成 单独 的 线段 〈 如 图 5.13c 所 示 ) 。 所 以 27 个 顶点 就 会 生成 "条 线段 。 
线 列 表 与 线条 带 的 区 别 是 : 线 列 表 中 的 线段 可 以 彼此 分 开 ， 而 线条 带 中 
的 线段 则 是 相连 的 。 如 果 线 段 相 连 的 话 ， 绘 制 同样 数量 的 线段 便 会 占用 
更 少 的 顶点 ， 因 为 每 个 处 于 线条 带 中 间 位 置 的 顶点 都 可 以 同时 被 两 条 线 
段 所 共用 。 





5.5.2.4 三 角形 带 


通过 枚 举 项 D3D_PRIMITIVE_TOPOLOGY_TRIANGLESTRIP 来 指定 三 
角形 市 〈triangle strip) 。 当 使 用 三 角形 带 拓 扑 时 ， 所 绘制 的 三 角形 将 像 
图 5.13d 所 示 的 那样 被 连接 成 带 状 。 可 以 看 到 ， 在 这 种 三 角形 连接 的 结 
构 中 ， 处 于 中 间 位 置 的 项 点 将 被 相 邻 的 三 角形 所 共同 使 用 。 因 此 ， 利 用 
n 个 顶点 即 可 生成 n 一 2 个 三 角形 。 





(d) 


图 5.13 ”图 元 拓扑 (一 ) 
(a) 点 列表 ”(b) 线条 带 (cc) 线 列表 ”(d) 三 角形 带 




















经 过 观察 可 以 发 现 ， 在 三 角形 帝 中 ， 次 序 为 偶数 的 三 角形 与 次 序 为 
奇数 三 角形 的 绕 序 (winding order， 也 译作 环绕 顺序 等 ， 即 装配 图 元 的 
顶点 顺序 为 逆 时 针 或 顺 时 针 方 辐 〉 是 不 同 的 ， 这 就 是 吻 除 (culling， 亦 
称 消 隐 ) 问题 的 由 来 “参见 5.10.2 节 ) 。 为 了 解决 这 个 问题 ，GPU 内 部 
会 对 偶数 三 角形 中 前 两 个 顶点 的 顺序 进行 调换 ， 以 此 使 它们 与 奇数 三 角 
形 的 绕 序 保持 一 致 。[9 





5.5.2.5 三 角形 列表 


通过 枚 举 项 D3D_PRIMITIVE_TOPOLOGY_TRIANGLELIST 来 指定 三 
角形 列表 (triangle list) 。 当 使 用 三 角形 列表 拓扑 时 ， 在 绘制 调用 的 过 
程 中 会 将 每 3 个 顶点 装配 成 独立 的 三 角形 (如 图 5.14a 所 示 〉; 所 以 每 3n 
个 顶点 会 生成 "个 三 角形 。 三 角形 列表 与 三 角形 带 的 区 别 是 : 三 角形 列 
表 中 的 三 角形 可 以 彼此 分 离 ， 而 三 角形 帝 中 的 三 角形 则 是 相连 的 。 


5.5.2.6 ”具有 邻接 数据 的 图 元 拓扑 











对 于 存 有 邻接 数据 的 三 角形 列表 而 言 ， 每 个 三 角形 都 有 3 个 与 之 相 
邻 的 邻接 三 角形 (adjacent triangle) 。 图 5.14b 中 展示 的 就 是 这 种 图 元 拓 
扑 。 在 几何 着 色 器 中 ， 往 往 需 要 访问 这 些 邻 接 三 角形 来 实现 特定 的 几何 
着 色 算 法 。 为 了 使 几何 着 色 器 可 以 顺利 地 获得 这 些 邻 接 三 角形 的 信息 ， 
我 们 就 需要 借助 顶点 缓冲 区 与 索引 缓冲 区 〈indexbuffer) 将 它们 随 主 三 
角形 一 并 提交 至 泻 染 流 水 线 。 另 外 ， 此 时 一 定 要 将 拓扑 类 型 指定 
为 D3D_PRIMITIVE_TOPOLOGY_TRIANGLELIST_ADJ]， 只 有 这 样 ， 泻 染 
流水 线 才 能 得 知 如 何以 顶点 缓冲 区 中 的 顶点 来 构建 主 三 角形 及 其 邻接 三 
角形 。 注 意 ， 邻 接 图 元 的 顶点 只 能 用 作 几 何 着 色 器 的 输入 数据 ， 却 并 不 
会 被 绘制 出 来 。 即 便 程 序 没有 用 到 几何 着 色 器 ， 但 依旧 不 会 绘制 邻接 图 
Jo。 
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图 5.14 ”图 元 拓扑 (二) 
(a) 三 角形 列表 ”〈(b)〉 具有 邻接 数据 的 三 角形 列表 一 一 通过 观察 可 以 发 现 ， 每 个 三 角形 共 需 
要 6 个 顶点 来 描述 它 及 其 邻接 的 三 角形 。 因 此 ，67n 个 顶点 可 以 生成 nn 个 三 角形 及 其 邻接 数据 线 
列表 、 线 条 人 带 和 三 角形 带 也 存在 含有 邻接 数据 的 图 元 拓扑 ， 相 关 细 节 可 参考 SDK 文 档 










































































5.5.2.7 ”控制 点 面 片 列表 


D3D_PRIMITIVE TOPOLOGY N_CONTROL POINT_PATCHLIST 拓 扑 
类 型 表示 : 将 顶点 数据 解释 为 具有 NN 个 控制 点 (control point) 的 面 片 列 
表 (patch list) 。 此 图 元 常用 于 泻 染 流水 线 的 曲面 细 分 阶段 (tessellation 
stage， 此 环节 为 可 选 阶段 ，， 因 此 ， 我 们 将 这 种 列表 拓扑 延至 第 14 章 中 
再 进行 讨论 。 


5.5.3 ”索引 


如 前 所 述 ， 三 角形 是 3D 实 体 对 象 的 基本 组 成 部 分 。 下 列 代码 中 的 








两 个 顶点 数组 分 别 展示 的 是 用 于 构建 一 个 四 边 形 以 及 一 个 八 边 形 所 用 的 
三 角形 列表 〈 即 其 中 的 每 3 个 顶点 将 构成 一 个 三 角形 ) 
Vertex quad[6] = { 


ve, v1l, v2, // 三 
ve, v2, v3, // 三 


}; 


Vertex octagon[24] 
ve@,， v1, v2,， 
VO@，V2，V3， 
ve@,， v3，v4,， 
vO@, V4, V5, 
ve@, v5, v6, 
vO@,， Vv6,， V7， 
VO, V7， V8, 
ve@, v8, v1 








为 三 角形 指定 顶点 顺序 是 一 项 十 分 重要 的 工作 ， 我 们 称 这 个 顺序 为 
绕 序 (winding order) ， 细 节 可 见 5.10.2 节 。 


如 图 5.15 所 示 ， 构 成 3D 物 体 的 不 同 三 角形 会 共用 许多 顶点 。 更 具体 
的 例子 如 图 5.15a 中 构成 四 边 形 的 两 个 三 角形 都 使 用 了 顶点 vo 和 v2。 因 共 
用 两 个 顶点 而 复制 两 个 顶点 数据 的 情况 还 不 是 太 糟 ， 但 是 像 八 边 形 那 样 
的 例子 可 就 麻烦 了 《〈 见 图 5.15b) ， 因 为 每 个 三 角形 不 仅 都 复制 了 一 份 
中 心 顶 点 20， 而 且 此 八 边 形 边 上 的 每 个 顶点 都 被 两 个 三 角形 所 同时 共 

。 一 般 来 说 ， 随 着 模型 细节 和 复杂 度 的 增加 ， 复 制 顶点 的 数量 亦 会 急 
剧 上 升 。 





图 5.15 “顶点 的 共用 














(a) 由 两 个 三 角形 构建 的 四 边 形 ”〈b)〉 通过 8 个 三 角形 构建 的 八 边 形 











我 们 不 和 希望 复制 顶点 数据 的 原因 有 两 个 : 


1. 增加 内 存 的 需求 一 一 为 什么 要 多 次 存储 同一 个 顶点 数据 呢 ? 





2. 增加 图 形 硬件 的 处 理 猴 蓓 
据 呢 ? 





么 要 多 次 处 理 同一 个 顶点 数 





借助 三 角形 带 可 以 在 茶 些 情况 下 改善 顶点 的 复制 问题 ， 前 提 是 这 些 
几何 体能 够 被 组 织 为 带 状 结构 。 但 是 ， 由 于 三 角形 列表 更 为 灵活 《该 拓 
扑 中 的 三 角形 都 无 需 互 相连 接 ) ， 所 以 值得 花 些 心思 研究 一 种 利用 三 角 
形 列 表 移 除 重复 项 点 的 设计 方案 。 在 此 ， 我 们 所 采用 的 解决 方法 是 使 用 
索引 (index〉。 整 个 工作 流程 是 这 样 的 ， 先 创建 一 个 顶点 列表 和 一 个 
索引 列表 。 在 顶点 列表 中 收录 一 份 所 有 独立 的 顶点 ， 并 在 索引 列表 中 存 
储 顶 点 列表 的 索引 值 ， 这 些 索 引 定义 了 顶点 列表 中 的 顶点 是 如 何 组 合 在 
一 起 ， 从 而 构成 三 角形 的 。 回 顾 图 5.15 可 知 ， 构 建 四 边 形 的 顶点 列表 如 
下 


Vertex v[4] = {ve, v1i, v2, v3}; 








接 下 来 ， 我 们 需要 创建 索引 列表 ， 以 此 来 定义 如 何 将 顶点 列表 中 的 
顶点 组 合成 两 个 三 角形 。 


UINT indexList[6] = {6，1，2，// 三 角形 6 














6，2，3}; // 三 角形 1 











在 索引 列表 中 ， 每 3 个 元 素 定 义 了 一 个 三 角形 。 所 以 上 面 的 索引 意 
为 : “通过 顶点 v[86],v[1] 和 v[2] 来 组 成 三 角形 0， 再 借助 顶点 
v[86],v[2] 和 v[3] 来 构成 三 角形 1。” 


相似 地 ， 图 中 八 边 形 的 顶点 列表 构造 如 下 : 


Vertex v[9] = {ve, v1, v2, v3, Vv4, v5, Vv6, Vv7, Vv8}; 


相应 的 索引 列表 是 : 





UINT indexList[24] = { 
6，1，2， 三 角形 
三 角形 

三 角形 

三 角形 


三 角形 
三 角形 
三 角形 
三 角形 








竺 处 理 完 顶点 列表 中 那些 独立 的 顶点 之 后 ， 显 卡 就 能 通过 索引 列表 
把 顶点 组 合成 一 系列 三 角形 。 可 以 看 到 ， 我 们 已 经 将 “ 复 用 的 顶点 数 
据 ? 转 化 为 索引 列表 ， 但 是 这 样 做 的 效果 要 比 之 前 的 方法 更 好 ， 这 和 是 因 
为 : 





1. 索引 第 是 简单 的 整数 ， 不 会 像 使 用 整个 顶点 结构 体 那 样 占 用 更 








多 的 内 存 〈 而 且 ， 随 着 顶点 结构 体 中 分 量 的 不 断 增 多 ， 将 会 使 内 存 的 需 
求 变 得 更 为 急迫 ) 


2， 若 辅 以 适当 的 顶点 缓存 排序 ， 则 图 形 硬件 将 不 必 再 次 处 理 重复 
使 用 的 顶点 ， 从 缓存 中 直接 取得 即 可 〈 这 种 情况 十 分 普遍 ) 加。 





5.6 ”顶点 独 色 需 阶 段 


竺 图 元 被 装配 完毕 后 ， 其 顶点 就 会 被 送 入 顶点 着 色 峰 阶段 (vertex 
shader stage， 简 记 作 VS) 。 我 们 可 以 把 顶点 着 色 占 看 作 一 种 输入 与 输出 
数据 丝 为 单个 顶点 的 函数 。 每 个 要 被 绘制 的 顶点 都 须 经 过 顶点 着 色 器 的 
处 理 再 送 往 后 续 阶 段 。 事 实 上 ， 我 们 可 以 认为 在 硬件 中 执行 的 是 下 列 处 
理 过 程 : 


for(UINT i = 6; i < numVertices; ++i) 


outputVertex[i] = VertexShader( inputVertex[i] ); 





其 中 的 顶点 着 色 器 函数 〈VertexShader) 就 是 我 们 要 实现 的 那 一 部 
分 ， 因 为 在 这 一 阶段 中 对 项 点 的 操作 实际 是 由 GPU 来 执行 的 ， 所 以 速度 


我 们 可 以 利用 顶点 着 色 器 来 实现 许多 特效 ， 例 如 变换 、 光 照 和 位 移 
贴图 (displacement mapping， 也 译作 置换 贴图 。map 有 了 映射 之 意 ， 因 此 
也 有 译作 位 移 映 射 ， 类 似 的 还 有 在 后 面 将 见 到 的 纹理 贴图 、 法 线 贴图 
等 ) 。 请 牢记 : 在 顶点 着 色 器 中 ， 不 但 可 以 访问 输入 的 顶点 数据 ， 也 能 
够 访问 纹理 和 其 他 存 于 显存 中 的 数据 (如 变换 矩阵 与 场景 的 光照 信 


息 ) oO 


我 们 将 在 全 书 中 看 到 各 种 不 同 的 顶点 着 色 露 示例， 所 以 在 完成 本 书 
的 学 习 后 ， 我 们 应 当 会 对 它 可 以 实现 的 具体 功能 有 一 个 深刻 的 认识 。 在 
本 书 的 第 一 个 代码 示例 中 ， 我 们 仅 用 顶点 着 色 器 对 顶点 进行 变换 处 理 。 





接 下 来 ， 我 们 将 介绍 几 种 常用 的 空间 变换 。 
5.6.1 局 部 空间 和 世界 空间 


试想 我 们 正在 为 一 部 电影 而 奔忙 ， 而 我 们 所 在 的 团队 必须 为 一 些 特 
效 镜头 打造 一 个 与 火车 有 关 的 微缩 场景 。 其 中 ， 我 们 的 具体 任务 是 制作 
一 架 袖 珍 小 桥 。 当 然 ， 我 们 并 不 会 把 桥 直 接 搭 建 在 场景 之 中 ， 否 则 ， 便 
要 在 一 个 极其 复杂 的 环境 中 小 心中 串 地 操作 ， 以 防 破 坏 场景 中 的 其 他 
景物 ， 一 旦 失手 便 会 功 亏 一 筑 。 相 对 来 讲 ， 我 们 更 加 愿意 在 远离 场景 的 
工作 室内 制作 此 模型 。 竺 大功告成 之 后 ， 才 会 把 它 以 恰当 的 角度 置 于 场 
景 中 合适 的 位 置 。 




















3D 美 工 们 在 构筑 3D 对 象 时 也 在 做 着 类 似 的 事情 。 他 们 并 不 会 在 全 
局 场景 坐标 系 〈 即 世界 空间 ， 也 译 为 世界 坐标 系 ，world space) 中 构建 
物体 的 几何 形状 ， 而 是 相对 于 局 部 坐标 系 〈 局 部 空间 ， 也 译 为 局 部 坐标 
系 ，local space) 来 创建 物体 。 局 部 坐标 系 通常 是 一 种 以 目标 物体 的 中 
心 为 原点 (也 有 例外 ， 视 具体 情况 而 定 ) ， 并 且 坐 标 轴 与 该 物体 对 齐 的 
简易 便 用 华 标 系 404。 只 要 在 局 部 空间 中 定义 了 3D 模 型 的 各 项 点， 我 们 
就 能 将 它 变换 至 全 局 场景 之 中 。 为 了 做 到 这 一 点 ， 我 们 还 必须 定义 局 部 

空间 与 世界 空间 两 者 的 联系 。 具 体 的 实现 方法 是 : 根据 物体 的 位 置 与 朝 
向 ， 指 定 其 局 部 空间 坐标 系 的 原点 和 诸 坐 标 轴 相 对 于 全 局 场景 坐标 系 的 
坐标 ， 再 运用 坐标 变换 即 可 将 物体 从 局 部 空间 变换 至 世界 空间 《参见 图 
5.16 并 重 温 3.4 节 ) 。 将 局 部 坐标 系 内 的 坐标 转换 到 全 局 场景 坐标 系 中 的 
过 程 叫 作 世 界 变 换 (world transform) ， 所 使 用 的 变换 矩阵 名 为 世界 窍 








阵 《〈world matrix) 。 由 于 场景 中 每 个 物体 的 朝向 和 位 置 都 可 能 各 不 相 
同 ， 因 此 它们 都 有 自己 特定 的 世界 矩阵 。 当 每 个 物体 都 从 各 自 的 局 部 空 
间 变 换 到 世界 空间 后 ， 它 们 的 坐标 都 将 位 于 同一 坐标 系 〈 即 世界 坐标 
系 ) 之 中 。 如 果 和 希望 直接 在 世界 空间 内 定义 一 个 物体 ， 那 么 就 可 以 使 用 
单位 世界 矩阵 (identity world matrix) 。 


志 界 举 标 系 
aAl 














图 5.16 ”图 a 中 ， 每 一 个 物体 都 相对 于 自己 的 局 部 坐标 系 来 定义 各 上 自 的 顶点 。 男 外 ， 我 们 还 要 根 

据 物体 在 场景 中 的 具体 方位 来 相对 于 世界 空间 坐标 系 定义 每 个 局 部 坐标 系 的 位 置 与 朝向 。 接 下 

来 ， 再 通过 坐标 变换 把 所 有 物体 的 坐标 都 变换 至 世界 空间 坐标 系 。 图 pb 中 ， 完 成 世界 变换 之 
后 ， 物 体 的 顶点 坐标 都 将 统一 用 世界 坐标 系 来 表示 

































































在 每 个 3D 模 型 各 自 的 局 部 坐标 系 中 来 定义 它们 有 知 干 优点 : 





1. 易于 使 用 。 例 如 ， 物 体 的 中 心 通常 位 于 局 部 空间 中 的 原点 ， 并 
且 关 于 主轴 对 称 。 举 个 例子 ， 当 我 们 采用 一 个 以 立方 体 中 心 作为 原 反 ， 
且 坐 标 轴 正 区 于 各 立方 体面 的 局 部 坐标 系 时 ， 我 们 就 能 轻而易举 地 确定 
出 立方 体 的 各 个 顶点 。 整 个 过 程 如 图 5.17 所 示 。 


(2 ?, ?) 


(1, 1, 1) GQ, ?, ?) 


(-1, -1,-1) 


图 5.17 当 立 方 体 与 坐标 系 的 主轴 对 齐 且 其 中 心 位 于 化 标 系 的 原点 之 时 ， 它 的 顶点 是 十 分 易于 

确定 的 。 反 之 ， 当 一 个 立方 体 处 于 坐标 系 中 任意 的 位 置 以 及 朝向 的 时 候 ， 要 确定 它 的 顶点 坐标 

就 比较 困难 了 。 因 此 ， 在 构造 物体 的 时 候 ， 我 们 一 般 总 是 选择 以 物体 的 中 心 为 原点 且 轴 对 齐 于 
此 物体 的 简便 坐标 系 

















2. 物体 应 当 可 以 跨越 多 个 场景 而 重复 使 用 ， 所 以 将 物体 坐标 相对 
于 茶 个 特定 场景 进行 便 编 码 并 不 是 明智 之 举 。 更 好 的 办 法 则 是 保存 物体 
相对 于 局 部 坐标 系 的 顶点 坐标 ， 再 通过 坐标 变换 官 阵 去 定义 每 个 场景 中 
局 部 坐标 系 与 世界 坐标 系 的 关系 。 











3. 最 后 一 点 ， 我 们 有 时 可 能 需要 在 场景 中 多 次 绘制 同一 个 物体 ， 
但 是 它们 的 位 置 、 方 向 和 大 小 却 各 不 相同 〈 例 如 ， 将 一 个 树 形 对 象 绘制 
多 次 来 构成 一 片 森林 ) 。 如 大 在 每 次 创建 物体 实例 时 都 要 复制 它 的 顶点 
和 索引 数据 ， 将 极其 消耗 资源 。 因 此 ， 我 们 通常 的 做 法 是 存储 一 份 几何 
体 相 对 于 其 局 部 空间 的 副本 《〈 即 该 几何 体 的 顶点 列表 和 索引 列表 ) 。 接 
着 ， 按 所 需 次 数 来 绘制 此 物体 ， 每 次 辅 以 不 同 的 世界 矩阵 来 指定 物体 在 
世界 空间 中 的 位 置 、 方 同和 大 小 。 这 种 方法 称 为 实例 化 (instancing) 。 








正如 3.4.3 节 中 所 讲 ， 世 界 窍 阵 描述 着 物体 局 部 空间 与 世界 空间 的 联 





系 ， 而 列 于 矩阵 内 的 行 回 量 则 是 下 面 要 提 到 的 坐标 。 如 果 
=I, 1), Ww = (Uz, Uy, u:, 0), Vw = (Vz, Vy, V:, 0) 和 

ww 三 (wz, ww::g 分 别 描述 了 局 部 空间 内 的 原点 、z 轴 、y 轴 和 z 轴 相对 
于 世界 空间 的 齐 次 坐标 ， 那 么 由 3.4.3 节 中 的 内 容 可 知 ， 从 局 部 空间 至 世 
界 空 间 的 坐标 变换 矩阵 为 : 


Wr Wy Wi 0 
OQ: Q, Q. 1 
可 以 看 到 ， 为 了 构建 一 个 世界 和 矩阵， 我们 必须 弄 清 局 部 空间 中 原点 
和 各 坐标 轴 相 对 于 世界 空间 的 坐标 关系 。 但 这 样 做 有 时 并 不 简单 亦 不 直 
。 一 种 更 常用 的 办 法 是 定义 一 系列 的 变换 组 合 W， 即 W = SFRT。 首 
缩放 和 矩阵 5 将 物体 盎 放 到 世界 空间 ; 其 次 ， 旋 转 矩 阵 R 用 来 定义 局 
空间 相对 于 世界 空间 的 随同 ， 最 后 ， 平 移 算 阵 了 定义 的 是 局 部 空间 的 
ie s 间 的 位 置 。 重 温 3.5 节 可 知 ， 我 们 能 够 将 这 一 系列 变 
换 视 为 一 种 坐标 变换 ， 而 矩阵 W = SRT 中 的 行 向 量 则 分 别 存储 的 是 局 
部 空间 的 z 轴 、y 轴 、z 轴 及 原点 相对 于 全 局 空间 的 的 齐 次 坐标 。 


示例 





假设 我 们 在 局 部 空间 定义 了 一 个 单位 正方 形 ， 其 最 小 点 和 最 大 点 的 
坐标 分 别 为 (-0.5, 0, -0.5) 与 (0.5, 0, 0.5)。 现 在 要 求 出 一 个 世界 和 矩阵， 使 
此 正方 形 在 世界 空间 中 的 边 长 为 2， 在 世界 空间 zz 平面 内 顺 时 针 旋 转 45? 

， 且 中 心 位 于 世界 空间 的 坐标 (10, 0, 10) 处 。 据 此 ， 我 们 构造 矩阵 S、RR 





2 0 0 0 V2/2 0 —VvV2/2 0 1 0 0 0 

0100 0 1 0 0 0 1 0 0 

0020 V2/2 0 V2/2 0 0 0 1 0 

0001 0 0 0 1 10 0 10 1 
V2 0 一 vV2 0 


从 第 3.5 市 中 可 知 ， 和 矩阵 W 中 的 行 回 量 描述 了 此 正方 形 局 部 坐标 系 
的 诸 坐 标 轴 与 原点 相对 于 世界 空间 的 坐标 ， 即 有 ww = (V2,0, 一 V2,0) 
vw 二 (0,1,0,.0)，ww = (V2,0,V2,0) 和 Qw = (10.0.10.1)。 如 果 我 们 利用 矩阵 
W 将 此 局 部 空间 向 世 界 空间 进行 坐标 变换 ， 则 最 终 会 把 正方 形 置 于 题 设 
中 所 期 望 的 世界 空间 内 的 预定 位 置 ( 见 图 5.18)〉。 

















(10, O40) (V2, 0, V2) 
+Z 
局 部 空间 
(V2, 0,-V2) 
二 Re 
世界 空间 
Y 








图 5.18 世界 矩阵 中 行 向 量 所 描述 的 是 局 部 坐标 系 的 原点 与 众 坐标 轴 相 对 于 世界 坐标 系 的 坐标 





[一 0.5, 0, —0.5, 1]W = [10 - V2, 0, 0, 1] 


[一 0.5, 0, + 0.5, 1]W = [0, 0, 10 + V2, 1] 


[+0.5, 0, +0.5, 1]W = [10 + V2, 0, 0, 1] 


[十 0.5, 0, —0.5, 1]W = [0, 0, 10 — V2, 1] 


此 例 的 亮点 是 在 不 指明 @w、wuw、vw 和 ww 的 情况 下 ， 直 接 通 过 复 
合 一 系列 简单 的 变换 来 建立 世界 矩阵。 这 通常 比 用 Bw、ww、vw 和 ww 
求 取 世界 矩阵 的 方法 要 容易 得 多 ， 因 为 我 们 只 需 了 解 物 体 在 世界 空间 中 
的 大 小 、 朝 同 以 及 位 置 即 可 。 


男 一 种 考虑 世界 变换 的 观点 是 把 局 部 空间 坐标 当 作 世 界 空间 坐标 来 
看 待 〈 此 方法 束 相 当 于 用 单位 矩阵 进行 世界 变换 ) 。 这 样 一 来 ， 如 果 在 
物体 局 部 空间 的 原点 处 建 模 ， 那 么 该 物体 也 就 位 于 世界 空间 的 原点 处 。 
通常 来 说 ， 我 们 不 大 可 能 把 物体 全 都 建立 在 世界 空间 的 原点 处 。 所 以 往 
往 还 是 要 为 每 个 物体 运用 一 系列 变换 ， 使 之 缩放 、 旋 转 ， 并 令 其 位 于 世 
界 空间 中 的 预定 位 置 。 从 数学 角度 上 来 讲 ， 这 种 变换 与 由 局 部 空间 转换 
至 世界 空间 所 用 的 坐标 变换 矩阵 进行 的 是 同一 种 世界 变换 。 





5.6.2 ”观察 空间 


为 了 构建 场景 的 2D 图 像 ， 我 们 必须 在 场景 中 架设 一 台 虚 拟 摄 像 
机 。 该 摄像 机 确定 了 观察 者 可 见 的 视野 ， 也 就 是 生成 2D 图 像 所 需 的 场 
景 空间 范围 。 对 此 ， 我 们 先 为 该 摄像 机 赋予 一 个 图 5.19 所 示 的 局 部 坐标 
系 ( 这 被 称 作 观 察 空间 (view space) ， 也 译作 观察 坐标 系 、 视 图 空 
间 、 视 觉 宝 间 〈eye Space) 或 摄像 机 空间 (camera space) ) 。 在 此 人 举 
标 系 中 ， 该 虚拟 摄像 机 位 于 原点 并 沿 z 轴 的 正方 问 观 察 ，z 轴 指 回 摄 像 机 








的 右 侧 ，y 轴 则 指 癌 摄像 机 的 上 方 。 与 相对 于 世界 空间 来 描述 场景 中 的 
物体 顶点 不 同 ， 观 罕 空 间 用 于 在 泻 染 流水 线 的 后 续 阶 段 中 插 述 这 些 顶 点 
相对 于 摄像 机 坐标 系 的 坐标 。 由 世界 空间 至 观察 空间 的 坐标 变换 称 为 取 
景 改 换 (view transformn， 也 译作 观察 变换 、 视 图 变换 等 ) ， 此 变换 所 用 
的 矩阵 则 称 为 观察 是 阵 〈vyiew matrix， 亦 译作 视图 矩阵 〉。 














世界 坐标 系 





图 5.19 ”将 世界 空间 中 的 顶点 坐标 变换 至 摄像 机 空间 


如 果 &w = (Q;, Qy, Q., 1) Ww = (Ur, Uy U0), vw = (vz, Vy, Vz,0)L) 
及 ww = (ur wy,W:,0)， 分 别 表示 了 观察 空间 中 原点 、z 轴 、y 轴 和 z 轴 相 
对 于 世界 空间 的 齐 次 坐标 。 那 么 ， 根 据 3.4.3 节 中 的 内 容 可 知 ， 由 观察 空 
间 到 世界 空间 的 坐标 变换 矩阵 为 : 











Ur Uy Uu: 0 
Ur Vy vv: 0 
W = : 


wr Wy WwW: 0 
Cr © 


vy YY 


然而 这 并 不 是 我 们 所 期 竺 的 变换 。 刚 好 相反 ， 我 们 需要 的 是 从 世界 
空间 到 观察 空间 的 这 一 道 变换。 回顾 3.4.5 节 可 知 ， 逆 变换 可 由 变换 矩阵 
的 逆 来 求 得 ， 所 以 从 世界 空间 到 观察 空间 的 坐标 变换 矩阵 为 V7!。 














世界 坐标 系 和 观 岁 坐标 系 通常 只 有 位 置 和 朝 问 这 两 点 差异 ， 所 以 由 
观察 空间 到 世界 空间 的 变换 可 以 直接 表示 为 多 = RT〈 即 世界 矩阵 可 以 
分 解 为 一 个 旋转 窍 阵 与 一 个 平移 矩阵 的 乘积 ) 。 此 形式 使 得 上 述 逆 变换 
更 易于 计算 : 








1 0 0 0 7 7 U7 es LO7 0 
0 | 0 0 Uy Vy Wy 0 Uy Uy Wy 0 
0 0 ] 0 hse "Uae Ds A U. U- LO- 0 
OO: 0, CO 1 0 0 0 1 一 已 .1 一 人 GD —Q:w 1 





因此 ， 观 察 矩 阵 形 为 : 


Ur Ur Wr 0 
Uy Uy LW 0 
V= 


U. U. LO- U 


QFu 一 GD —Q:w 1 





现在 我 们 来 展示 一 种 用 以 构建 观察 矩阵 中 诸 癌 量 的 直观 方法 。 设 Q@ 
为 虚拟 摄像 机 的 位 置 ， 工 为 此 摄像 机 对 准 的 观察 目标 点 (target 
point) 。 接 下 来 ， 设 7 为 表示 世界 空间 “同上 ? 方 癌 的 单位 癌 量 。《〈 在 本 
书 中 ， 我 们 用 世界 空间 中 的 平面 ro 作为 场景 中 的 “地 平面 >， 并 以 世界 空 
间 的 y 轴 来 指示 场景 内 “向 上 ”的 方向 。 因 此 ，7 = (101g 仅 是 平行 于 世界 
空间 中 ! 轴 的 一 个 单位 向 量 。 有 时 为 了 方便 起 见 ， 一 些 应 用 程序 也 可 能 
选择 平面 zy 作为 地 平面 ， 而 选 z 轴 来 指示 “同上 ?的 方 同 ) 。 对 于 图 5.20 来 
讲 ， 虚 拟 摄像 机 的 观察 方向 为 : 














TT— 0Q 
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该 向 量 表示 虚拟 摄像 机 局 部 空间 的 : 轴 。 指 向 wu“ 右 侧 "的 单位 向 量 


加 JI X 10 


jx al 





它 表 示 的 是 虚拟 摄像 机 局 部 空间 的 z 轴 。 最 后 ， 该 摄像 机 局 部 空间 
的 y 轴 为 : 
UWwWxXU 
因为 w 和 uw 为 互相 正 交 的 单位 癌 量 ， 所 以 w x 4 亦 必 为 单位 问 量 。 由 
此 ， 我 们 也 就 无 须 对 问 量 w 进 行规 范 化 处 理 了 。 

















图 5.20 ”根据 指定 的 摄像 机 位 置 、 观 察 的 目标 点 以 及 世界 空间 的 “向 上 ”向 量 来 构建 摄像 机 坐标 
系 


综 上 上 所 述 ， 只 要 给 定 摄 像 机 的 位 置 、 观 察 目 标点 以 及 世界 空间 


中 “同上 ?方向 的 向 量 ， 我 们 就 能 构建 出 对 应 的 摄像 机 局 部 坐标 系 ， 并 推 
导出 相应 的 观察 矩阵 。 











DirectXMath 库 针对 上 述 计算 观察 抢 阵 的 处 理 流 程 提供 了 以 下 函 


数 : 


XMMATRIX XM CALLCONV XMMatrixLookAtLH( // 输出 观察 矩阵 V 
FXMVECTOR EyePosition, // 输入 虚拟 摄像 机 位 置 Q 


FXMVECTOR FocusPosition, // 输入 观察 目标 点 T 
FXMVECTOR UpDirection) ; // 输入 世界 空间 中 向 上 方向 的 向 量 j 




















一 般 来 说 ， 世 界 空间 中 的 y 轴 方 回 与 虚拟 摄像 机 “向 上 ” 同 量 的 方 癌 
相同 ， 所 以 ， 我 们 通常 将 “向 上 ”向 量 定 为 7 = (0,1,0)。 举 个 例子 ， 假 设 
我 们 希望 把 虚拟 摄像 机 架设 于 世界 空间 内 点 (5, 3, -10) 的 位 置 ， 并 令 它 
观察 世界 空间 的 原点 《0, 0, 0〉 ， 则 构建 相应 观察 矩阵 的 过 程 为 : 








XMVECTOR pos = XMVectorSet(5，3，-16，1.6f); 
XMVECTOR target = XMVectorzZero(); 
XMVECTOR up = XMVectorset(6.6f, 1.6f, 60.06f, 6.6f); 





XMMATRIX V = XMMatrixLookAtLH(pos, target, up); 
5.6.3 ”投影 和 齐 识 裁 甬 空间 


前 一 节 我 们 讲解 了 摄像 机 在 世界 空间 中 的 位 置 和 朝 癌 ， 除 此 之 外 ， 
它 还 有 另 一 个 关键 组 成 要 素 : 即 摄像 机 可 观察 到 的 空间 体积 〈volume of 
space) 。 此 范围 可 用 一 个 由 四 校 锥 截取 的 平 截 头 体 〈frustum， 即 四 校 
台 ) 来 表示 《〈 如 图 5.21 所 示 ) 。 





观察 点 /投影 中 心 


图 5.21 定义 摄像 机 所 “观察 空间 体积 的 平 截 头 体 


下 一 个 任务 是 : 将 平 截 头 体内 的 3D 几 何 体 投 影 到 一 个 2D 投 影 窗口 
(projection window) 之 中 。 根 据 前 文 所 述 的 透视 投影 〈perspective 
projection ) 的 原理 可 知 ， 投 影 必 将 沿 众 平行 线 汇聚 于 消失 点 上 ， 而 且 随 
着 物体 3D 深 度 的 增加 ， 其 投影 的 尺寸 也 将 逐渐 变 小 〈 见 图 5.22〉。 我 们 
将 由 顶点 到 观察 点 (eye point， 也 译作 视点 ) 的 连 线 称 为 顶点 的 投影 线 
(vertex’s line of projection) 。 继 而 就 可 以 定义 出 : 将 3D 顶 点 v 变 换 至 其 
投影 线 与 2D 投 影 平 面 交 点 vw' 的 透视 投影 变换 〈perspective projection 
transformation) 。 我 们 称 点 w 为 点 zw 的 投影 。3D 物 体 的 投影 即 为 构成 该 
物体 上 所 有 顶点 的 投影 。 























图 5.22 ”在 3D 空 间 中 ， 两 个 大 小 相同 ， 但 却 处 于 不 同 3D 深 度 的 圆柱 体 。 人 靠近 观 察 点 的 圆柱 体 投 
影 要 大 于 远离 观察 点 的 圆柱 体 投影 。 位 于 平 截 头 体 中 的 几何 体会 被 投射 到 投影 窗口 内 ， 而 平 截 
头 体 之 外 的 几何 体 则 会 被 投射 到 投影 平面 上 ， 投 影 窗 口 以 外 的 区 域 











5.6.3.1 定义 平 截 头 体 


在 观察 空间 中 ， 我 们 可 以 通过 近乎 面 (near plane， 也 详 作 近 裁 剪 
面 ) n、 远 平面 (far plane， 也 译作 远 裁 剪 面 ) 大 垂直 视 场 角 〈vertical 
field of view angle) a 以 及 纵横 比 (aspect ratio， 也 作 宽 高 比 ) > 这 4 个 参 
数 来 定义 一 个 : 以 原点 作为 投影 的 中 心 ， 并 沿 z 轴 正方 向 进行 观察 的 平 
截 头 体 〈 可 参见 图 5.23) 。 值 得 注意 的 是 ， 位 于 观察 空间 中 的 远 、 近 平 
面 几 平行 于 平面 zy， 因 此 ， 我 们 就 能 方便 地 确定 出 它们 分 别 治 > 轴 到 原 
点 的 距离 。 纵 横 比 的 定义 为 = WwW/， 其 中 为 投影 窗口 的 宽度 ，h 为 投 
影 窗 口 的 高 度 〈 以 观察 空间 的 单位 为 准 ) 。 投 影 衫 口 实质 上 即 为 观察 衬 
间 中 场景 的 2D 图 像 。 由 于 该 图 像 终 将 被 映射 到 后 侣 缓冲 区 中 ， 因 此 ， 
我 们 希望 令 投 影 窗口 与 后 人 台 组 冲 区 两 者 的 纵横 比 保持 一 致 。 为 此 ， 我 们 
通常 将 投影 窗口 的 纵横 比 指定 为 后 台 绥 冲 区 的 纵横 比 〈 比 值 并 没有 单 
位 ) 。 例 如 ， 假 设 后 人 台 绥 冲 区 的 大 小 为 800 x 600， 那 么 我 们 就 指定 














SU0 
600 ”““。 如 车 投 影 窗口 与 后 台 缓冲 区 的 纵横 比 不 一 致 ， 那 么 映 
射 的 过 程 中 ， 就 需要 对 投影 窗口 在 将 投影 窗口 进行 不 等 比 缩放 (non- 
uniform scaling， 也 有 将 其 译 为 非 均 勾 缩 放 ， 非 一 致 性 缩放 或 非 统 一 缩 
放 ) ， 继 而 导致 图 像 出 现 拉 伸 变 形 的 现象 〈 例 如 ， 投 影 窗 口中 的 圆 形 映 
射 到 后 台 缓 冲 区 时 ， 可 能 会 被 拉 伸 为 椭圆 形 〉。 


1.333 











我 们 现在 通过 垂直 视 场 角 a 和 纵横 比 r 来 确定 水 平视 场 角 (horizontal 
field of view angle) 5。 为 此 ， 给 出 相关 示意 图 5.23。 注 意 ， 投 影 窗 口 的 
实际 大 小 并 不 重要 ， 关 键 在 于 确定 纵横 比 。 因 此 ， 出 于 方便 ， 我 们 将 高 
定 为 2， 而 宽 则 必 满 足 : 








为 了 求 出 具体 的 垂直 视 场 角 a， 我 们 假定 投影 窗口 到 原点 的 距离 为 d 


[el l a 
tan (=) 二 一 坊 d = cot (=) 
2 d .2 


因此 ， 当 投影 窗口 的 高 度 为 2 且 垂 直 视 场 角 为 ac 时 ， 我 们 就 能 确定 该 
投影 窗口 治 z 轴 到 观察 点 的 距离 4L。 已 知 这 些 条 件 ， 即 可 求 取 水 平视 场 角 
3。 观察 图 5.23 中 的 平面 zz 可 以 发 现 : 


于 Tr 
tan | 一】 一 一 
2 d cot (3) 
人 
=7T* tan (=) 
2 


所 以 ， 一 旦 给 定 垂 和 直 视 场 角 ac 和 纵横 比 >， 我 们 必 能 求 出 水 平视 场 角 











G 
8 = 2arctan |7 .ta7 














图 5.23 ”根据 指定 的 垂直 视 场 角 ax 和 纵横 比 r 来 推导 水 平视 场 角 刀 





5.6.3.2 ”投影 顶点 


我 们 希望 求 出 给 定点 (z,y,:) 在 投影 平面 : = d 中 的 投影 (z,y,d 
) ， 见 图 5.24。 通 过 在 z 轴 和 y 轴 上 分 别 利用 相似 三 角形 的 性 质 ， 我 们 可 
以 发 现 ; 























r/ 1 ， Td zcot(la/2) I 
i 四 > T - -一 - - 

d Z Z 2 ztanla/2) 
yy ， yd vcot(la/2) 1 

i nit > vy -一 RS 
d z 2 2 ztanla/2) 


同时 不 难看 出 ， 大 点 (全 少 习 位 于 平 截 头 体内 ， 当 且 仅 当 : 











投影 窗口 


投影 窗口 





图 5.24 ”利用 相似 三 角形 的 性 质 来 求 取 目标 点 在 投影 平面 内 的 投影 


5.6.3.3 ”规格 化 设备 坐标 





在 前 一 小 节 里 ， 我 们 讨论 了 如 何在 观察 空间 中 计算 诸 点 的 投影 坐 
标 。 在 计算 过 程 中 ， 要 保证 观察 空间 里 投影 窗口 的 高 为 2， 宽 为 2"， 这 r 
即 为 纵横 比 。 但 是 ， 如 果 投 影 窗 口 的 尺寸 依赖 于 纵横 比 便 会 产生 一 个 问 
题 ， 由 于 硬件 会 涉及 一 些 与 投影 窗口 大 小 有 关 的 操作 (诸如 将 投影 窗口 
映射 到 后 台 绥 冲 区 等 ) ， 这 意味 着 我 们 还 需要 将 纵横 比 告知 便 件 。 
此 ， 如 果 能 去 除 投影 窗口 对 纵横 比 的 依赖 ， 那 么 处 理 过 程 会 更 加 人 简单。 
对 此 ， 我 们 的 解决 办 法 是 将 z 坐 标 上 的 投影 区 间 从 一 ”7 给 放 至 归 一 化 区 

间 . 一 1, J， 就 像 下 面 这 样 : 

















经 此 映射 处 理 后 ，z 坐 标 和 y 坐 标 就 成 为 了 规格 化 设备 坐标 
(Normalized Device Coordinates，NDC) (请 注意 ， 这 里 并 没有 对 : 坐 
标 进 行 归 一 化 处 理 ) 。 此 时 ， 知 点 (Z, 泌 习 位 于 平 截 头 体 之 中 ， 当 且 仅 
| 


我 们 可 以 把 由 观察 空间 到 NDC 空 间 的 变换 视 为 一 种 单位 换算 Cunit 
conversion) 。 观 察 两 者 的 转换 过 程 ， 可 知 存在 如 下 关系 : 在 z 轴 上 ，1 
个 NDC 单 位 等 于 观察 空间 中 的 r 个 单位 〈 即 1ndc=rvs) 。 所 以 ， 若 给 
出 z 个 观察 空间 单位 ， 我 们 就 可 以 根据 上 述 关 系 将 它 转换 为 NDC 单 位 

《 式 中 的 vs 即 观察 空间 view space 的 缩写 ) : 








lndc zz 
= —ndc 
Tr VS 7 


我 们 可 以 基于 上 式 修 改 投影 公式 ， 从 而 直接 求 出 以 NDC 坐 标 来 表示 
的 z 轴 和 y 轴 上 的 投影 坐标 : 





， T 

一 一 一 

rztan(a/2) 
y 


2 tan(a/2) (B19 








注意 ， 在 NDC 坐 标 中 ， 投 影 窗口 的 高 和 宽 都 为 2， 所 以 它 的 大 小 是 
固定 的 ， 硬 件 也 就 无 须知 道 纵 横 比 。 但 是 ， 我 们 一 定 要 确保 将 投影 坐标 
映射 到 NDC 空 间 内 《图 形 便 件 假 设 我 们 会 完成 这 项 工作 ) 。 





5.6.3.4 ”用 和 矩阵 来 表示 投影 公式 


为 了 保证 变换 的 一 致 性 ， 我 们 将 用 和 矩阵 来 表示 投影 变换 。 然 而 ， 由 
于 式 (5.1) 的 非 线性 特征 ， 所 以 并 不 存在 与 之 对 应 的 矩阵 表示 。 我 们 
的 “ 决 罕 ? 是 将 其 “一 分 为 二 ”: 即将 其 分 为 线性 与 非 线性 两 个 处 理 部 分 。 
非 线性 部 分 要 进行 除 以 z 的 计算 过 程 。 正 如 在 下 节 中 所 讨论 的 ， 我 们 还 
将 对 :坐标 进行 归 一 化 处 理 ， 这 就 意味 着 在 执行 非 线性 部 分 除 以 > 的 计算 
时 ， 我 们 却 无 最 初 的 > 坐标 可 用 。 也 就 是 说 ， 我 们 一 定 要 在 此 变换 之 前 
保存 早先 传 入 的 初始 :坐标 。 为 了 做 到 这 一 点 ， 我 们 要 利用 齐 次 坐标 将 
输入 的 :坐标 复制 到 输出 的 w 坐 标 。 根 据 窍 阵 的 乘法 运算 法 则 ， 震 要 令 元 
素 20| = 1 以 及 元 素 3 引 | = 0 来 加 以 实现 “这 里 采用 的 是 以 0 为 基准 的 索 
引 ) 。 此 投影 矩阵 形 如 : 

















可 以 看 到 ， 我 们 在 矩阵 当中 设置 了 常量 4 和 常量 8 (在 下 一 市 中 会 
推导 它们 的 定义 ) ， 利 用 它们 即 可 把 输入 的 > 坐标 变换 到 归 一 化 范围 。 
令 任意 点 人 :2 4 与 该 矩阵 相 乘 将 会 得 到 : 


0 0 0 


rtan ( 全 ) 
0 下 -= 站 
[z, y, z, 1] tan($) 
(人 (U A 1 
0 0 B 0 
= 和 a 了 地 
rtan (3) tan ($) (5.2) 





在 顶点 与 投影 窍 阵 相 乘 之 后 〈 即 线性 部 分 ) ， 我 们 还 要 通过 将 每 个 
坐标 分 别 除 以 w = *《〈 即 非 线性 部 分 ) 来 完成 整个 变换 过 程 : 




















和 
nl mm | 全] 后 dl 了] 号 
(5.3) 
顺便 讲 一 下 ， 部 分 读者 可 能 会 怀疑 是 否 会 发 生 除 以 0 的 情况 。 然 


而 ， 事 实 上 即使 是 近乎 面 的 > 值 也 应 当 大 于 0， 所 以 处 于 这 一 位 置 上 的 点 
将 会 被 裁剪 〈5.9 节 ) 掉 。 除 以 ww 的 计算 过 程 有 时 被 称 为 透视 除法 
(perspective divide) 或 齐 次 除法 (homogeneous divide) 。 可 以 看 出 ， 
此 式 中 的 rz、7 投 影 坐 标 也 与 式 〈5.1) 中 的 一 致 。 


5.6.3.5 ”上 归 一 化 深度 值 


待 投影 操作 完毕 后 ， 所 有 的 投影 点 都 会 位 于 2D 投 影 窗口 上 ， 从 而 
构成 视觉 上 可 见 的 2D 图 像 。 看 起 来 ， 我 们 似乎 在 此 时 就 可 以 丢弃 原始 
的 3D :坐标 了 。 然 而 ， 为 了 实现 深度 缓冲 算法 ， 我 们 仍 需 保留 这 些 3D 深 
上 度 信 息 。 惑 像 Direct3D 和 希望 将 rz、yY 坐 标 映 射 到 归 一 化 范围 一 样 ， 深 度 坐 
标 也 要 被 映射 到 归 一 化 区 间 [0, 1 以 内 。 因 此 ， 我 们 必须 构建 一 个 保 序 
(order preserving ) 函数 9(:)， 用 来 把 :坐标 从 区 间 i7; f 映 射 到 区 间 |0; 1。 
由 于 该 函数 具有 保 序 性 ， 即 如 果 纪 , % € ln, | 昌 < 2%， 那么 9(21) < 9(22) 
。 也 就 是 说 ， 对 深度 值 进 行 归 一 化 处 理 后 ， 深 度 关 系 保持 不 变 。 所 以 ， 
在 实现 深度 缓冲 算法 的 过 程 中 ， 我 们 仍 能 在 归 一 化 区 间 内 正确 地 比较 出 
不 同 点 之 间 的 深度 关系 。 














虽然 通过 一 次 缩放 和 平移 操作 ， 便 能 将 :坐标 从 Wn, 中 区 间 映 射 到 [0， 
1] 区 间 。 但 i 前 的 投影 方案 中 去 。 从 式 
(5.3) 中 可 以 看 出 ，z 坐 标 将 经 过 以 下 变换 的 处 理 : 


g(z) = 人 4 -= 
现在 ， 我 们 需要 根据 下 列 约束 求 出 对 应 的 4 与 B: 
条 件 1: 9(m) = 4+B8/n = 二 0 (将 近 平面 映射 为 0) ; 
条 件 2: 9(f) = 4+B/f =1 (把 远 平面 映射 为 1) 。 


根据 条 件 1 解 得 B: 








B = —An 
将 B 代 入 条 件 2， 解 出 4 
—An 
本 十 一 
天 
Af 一 An _] 
了 
Af—An=f 了 
和 A 二 了 
汀 二 
所 以 ， 
f nf 





根据 函数 9 的 图 像 〈 见 图 5.25) 可 以 看 出 ， 它 是 严格 递增 《〈“ 保 序 性 ) 
的 非 线性 函数 。 同 时 ， 这 也 反映 了 94z) 大 部 分 取 值 是 由 近乎 面 附 近 的 深 
度 值 所 计算 得 出 的 。 换 言 之 ， 大 多 数 的 深度 值 被 集中 地 映射 到 了 取 值 区 
间 中 的 一 段 较 小 的 区 域内 。 这 将 引发 深度 缓冲 区 的 精度 问题 (由 于 计算 
机 表示 的 数值 范围 有 限 ， 使 计算 机 不 足以 区 分 归 一 化 深度 值 之 间 的 微小 
差异 ) 。 对 此 ， 我 们 一 般 建 议 令 近 平面 与 远 平 面 尽 可 能 地 接近 ， 以 改善 
深度 值 的 精度 问题 。 
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图 5.25 “不 同 近 平面 的 9z) 函 数 图 像 


既然 已 经 求 得 了 4 和 B， 我 们 就 可 以 确定 出 完整 的 透视 投影 窍 阵 


(perspective projection matrix) : 


让 
一 也 


在 顶点 乘 以 投影 算 阵 之 后 但 还 未 进行 透视 除法 之 前 ， 几 何 体会 处 于 
[= 


所 谓 的 齐 次 裁剪 空间 (homogeneous clip space) 或 投影 空间 (projection 
space) 之 中 。 待 完成 透视 除法 之 后 ， 便 是 用 规格 化 设备 坐标 CNDC ) 


来 表示 几何 体 了 。 
5.6.3.6 XMMatrixPerspectiveFovLH 所 数 


我 们 可 以 利用 DirectXMath 库 内 的 XMMatrixPerspectiveFovLH 函 
数 来 构建 透视 投影 矩阵 : 
// 返回 投影 矩阵 


XMMATRIX XM CALLCONV XMMatrixPerspectiveFovLH( 
float FovAngleY， // 用 弧度 制 表示 的 垂直 视 场 角 























float Aspect, // 纵横 比 = 宽度 / 高 度 
float Nearz, // 到 近 平 面 的 距离 
float Farz); // 到 远 平面 的 距离 











下 面 的 代码 片段 详细 解释 了 XMMatrixPerspectiveFovLH 函 数 的 用 
法 。 在 此 例 中 ， 我 们 将 垂直 视 场 角 指定 为 45”， 近 平面 位 于 z = 1 处 ， 远 
平面 位 于 z = 1000 处 《这些 长 度 彰 以 观察 空间 中 的 单位 表示 ) 。 


XMMATRIX P = XMMatrixPerspectiveFovLH(6.25f#xXM_PI， 
AspectRatio()，1.6f，166060.60f) 
纵横 比 和 采用 的 是 我 们 窗口 的 宽 高 比 : 


float D3DApp: :AspectRatio()const 
{ 


return static cast<float>(mClientWidth) / mClientHeight; 
} 





5.7 曲面 细 分 阶段 


曲面 细 分 阶段 (tessellation stages) 是 利用 镶嵌 化 处 理 技术 对 网 格 中 
的 三 角形 进行 细 分 (subdivide 〉， 以 此 来 增加 物体 表面 上 的 三 角形 数 
量 。 再 将 这 些 新 增 的 三 角形 仿 移 到 适当 的 位 置 ， 使 网 格 表 现 出 更 加 细腻 
的 细节 《〈 见 图 5.26) 。 














图 5.26 左 图 展示 的 是 原始 网 格 ， 右 图 呈现 的 是 经 曲面 细 分 阶段 处 理 后 的 网 格 





使 用 曲面 细 分 的 优点 有 以 下 几 方 面 。 


1. 我 们 能 借 此 实现 一 种 细节 层次 〈level-of-detail，LOD ) 机 制 ， 
使 离 虚 拟 摄像 机 较 近 的 三 角形 经 镶嵌 化 处 理 得 到 更 加 丰富 的 细节 ， 而 对 
距 摄像 机 较 远 的 三 角形 不 进行 任何 更 改 。 通 过 这 种 方式 ， 即 可 只 针对 用 
户 关注 度 高 的 部 分 网 格 增添 三 角形 ， 从 而 提升 其 细节 效果 。 








2. 我 们 在 内 存 中 仅 维 护 简单 的 低 柑 (low-poly， 低 精度 模型 ， 也 有 
译作 低 面 多 边 形 、 低 面 片 等 ) 网 格 ( 低 模 网 格 是 指 三 角形 数量 较 少 的 网 
格 ， 己 逐渐 形成 一 门 独特 画 风 的 艺术 制作 手段 ，， 再 根据 需求 为 它 动态 





地 增添 额外 的 三 角形 ， 以 此 节省 内 存 资源 。 


3. 我 们 可 以 在 处 理 动画 和 物理 模拟 之 时 采用 简单 的 低 模 网 格 ， 而 
仅 在 演 染 的 过 程 中 使 用 经 镶 找 化 处 理 的 高 模 (high-poly， 与 低 模 对 应 ) 
网 格 。 


曲面 细 分 是 Direct3D 11 中 新 引入 的 处 理 阶段 ， 它 们 为 我 们 提供 了 一 
种 利用 GPU 即 可 对 几何 体 进行 镶 租 化 处 理 的 手段 。 在 Direct3D 11 之 前 ， 
如 果 我 们 希望 实现 曲面 细 分 操作 ， 只 能 在 CPU 上 实现 这 项 任务 ， 而 且 经 
细 分 后 几何 体 必 须 上 传 回 GPU 中 ， 方 可 进行 泻 染 。 然 而 ， 将 新 几何 体 从 
CPU 端的 内 存 上 传 至 GPU 显存 的 过 程 十 分 绥 慢 ， 而 且 曲 面 细 分 计算 也 会 
增加 CPU 的 负担 。 由 于 这 些 原因 ， 在 Direct3D 11 之 前 ， 曲 面 细 分 方法 在 
实时 泻 染 图 像 方面 并 没有 流行 开 来 。 自 Direct3D 11 提 供 了 一 组 相关 的 
API 起 ， 才 使 得 曲面 细 分 技术 完全 可 以 在 与 Direct3D 11 兼 容 的 显卡 中 得 
以 实现 。 如 此 一 来 就 大 大 提高 了 曲线 细 分 技术 的 魅力 。 曲 面 细 分 是 一 个 
可 选 的 泻 染 阶 段 〈 可 在 用 户 需 要 之 时 才 开 启 ) 。 我 们 将 在 第 14 章 中 对 此 
阶段 进行 详细 的 讲解 。 














5.8 ”几何 大 色 上 融 阶 段 


几何 着 色 器 (geometry shader stage，GS) 是 一 个 可 选 演 染 阶段 ， 
由 于 我 们 从 第 12 章 起 才 会 用 到 它 ， 所 以 这 里 只 对 其 进行 简要 概述 。 几 何 
着 色 器 接受 的 输入 应 当 是 完整 的 图 元 。 例 如 ， 假 设 我 们 正在 绘制 三 角形 
列表 ， 那 么 向 几何 着 色 器 传 入 的 将 是 定义 三 角形 的 3 个 顶点。 注意 ， 
这 3 个 顶点 在 此 之 前 已 经 过 了 顶点 着 色 器 阶段 的 处 理 ) 几何 着 色 器 的 主 
要 优点 是 可 以 创建 或 销毁 几何 体 。 比 如 说 ， 我 们 可 以 利用 几何 着 色 器 将 
输入 的 图 元 拓展 为 一 个 或 多 个 其 他 图 元 ， 抑 或 根据 某 些 条 件 而 选择 不 输 
出 任何 图 元 。 顶 点 着 色 器 与 之 相 比 ， 则 不 能 创建 顶点 : 它 只 能 接受 输入 
的 单个 顶点 ， 经 处 理 后 再 将 该 顶点 输出 。 几 何 着 色 上 器 的 常见 拿手 好 戏 是 
将 一 个 点 或 一 条 线 扩展 为 一 个 四 边 形 。 





我 们 也 可 以 留心 观察 一 下 图 5.11 中 那 条 “ 流 输 出 (stream-out) ”阶段 
的 第 涉 。 这 也 就 意味 着 ， 几 何 着 色 器 能 够 为 后 续 的 绘制 操作 ， 而 将 项 点 
数据 流 输出 至 显存 中 的 某 个 缓冲 区 之 内 ， 我 们 将 在 后 续 章 节 中 对 这 种 高 
级 技术 展开 讨论 。 











5.9 ”裁剪 


完全 位 于 视 锥 体 (viewing frustuom， 用 户 在 3D 空 间 中 的 可 视 范 围 
( 形 如 平 截 头 体 ) 亦 常 被 称 为 视 锥 体 ， 也 有 译作 视 平 截 头 体 、 视 体 、 视 
景 体 等 ) 之 外 的 几何 体 需 要 被 丢 痉 ， 而 处 于 平 截 头 体 交 界 以 外 的 几何 体 
部 分 也 一 定 要 接受 被 裁 甬 《clip) 的 操作 。 因 此 ， 只 有 在 乎 截 头 体 之 内 
的 物体 对 象 才 会 最 终 保 留 下 来 。 图 5.27 详 细 地 演示 了 裁剪 处 理 效 果 。 








图 5.27 “裁剪 前 后 对 比 
(a) 裁 前 之 前 (b) 裁剪 之 后 


我 们 可 以 把 平 截 头 体 看 作 由 顶 、 底 、 左 、 右 、 近 、 远 这 6 个 平面 所 
围 成 的 空间 范围 。 为 了 裁 甬 一 个 与 平 截 头 体 相 区 的 多 边 形 ， 我 们 需要 对 
两 者 相交 的 每 个 平面 都 逐一 进行 裁 甬 操作 。 当 对 茶 个 存在 相交 的 平面 进 
行 裁 能 处 理 时 〈 见 图 5.28〉， 应 保留 多 边 形 位 于 正 半 空间 内 的 部 分 ， 并 
舍 去 其 负 半 空间 内 的 部 分 。 在 对 与 平面 相交 的 凸 多边形 裁 前 后 ， 最 终 得 
到 的 也 一 定 是 个 凸 多边形 。 由 于 裁剪 操作 是 由 人 硬件 来 负责 的 ， 所 以 我 们 
也 就 不 再 袭 述 其 具体 的 实现 细 市 。 但 是 ， 我 们 在 此 向 读者 推荐 一 种 比较 








流行 的 裁 甬 方 法 : 苏 泽 兰 ( 访 到 兰 伪 ) - 霍 奇 受 裁 甬 算法 (Sutherland- 
Hodgman clipping algorithm， 前 者 Ivan Sutherland 是 图 形 界 的 芮 基 人 ， 可 
en ee ee 
与 多 边 形 的 所 有 交点， 并 将 这 些 顶 点 按 顺 序 组 织 成 新 的 裁 甬 











[Blinn78] 叙 述 了 如 何在 4D 齐 次 空间 中 进行 裁剪 操作 〈 见 网 5.29) 。 
在 计算 完 透 视 除法 之 后 ， 位 于 视 锥 体内 的 点 就 都 要 用 规格 化 设备 坐标 
TY 2 
(5 ww 1) 来 表示 ， 而 坐标 中 的 分 量 范围 也 分 别 是 





一 上 < Tw <l 
—l<y/w<l 


0<z/w<l1 


在 进行 透视 除法 之 前 ， 位 于 齐 次 裁 勇 空间 中 视 锥 体内 的 4D 点 《 
y,>,W) 将 被 限制 在 以 下 范围 里 : 


一 WSKTQRU 


WYSU 


也 就 是 说 ， 这 些 点 将 位 于 下 列 6 个 4D 平 面 所 围 成 的 空间 之 内 : 
左 平面 : w = 
右 平 面 : w = 


底 平 面 : w = 





/ @ 

图 5.28 ”图 a 中 ， 裁 前 一 个 与 平面 相交 的 三 角形 。 图 b 中 ， 裁 前 后 的 三 角形 。 可 以 看 出 经 过 裁 前 

的 三 角形 已 不 再 是 一 个 三 角形 ， 而 是 一 个 四 边 形 。 因 此 ， 硬 件 还 需要 将 此 四 边 形 分 解 为 多 个 三 
角形 ， 这 对 于 凸 多 边 形 来 讲 是 比较 容易 实现 的 《向量 妈 用 于 区 分 正 半 空间 与 负 半 空间 ) 








图 5.29 “在 齐 次 裁剪 空间 中 ， 视 锥 体位 于 zu 平面 内 的 范围 

只 要 确定 了 视 锥 体 在 齐 次 空间 内 的 平面 方程 ， 我 们 即 可 运用 裁 勇 算 

法 (例如 苏 泽 兰 - 霍 奇 曼 裁剪 算法 ) 。 注 意 ， 由 于 可 以 从 数学 角度 上 将 
线段 与 平面 的 相交 检测 推广 到 RR 中 去 ， 所 以 我 们 能 够 用 4D 点 和 4D 平 面 
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该 ; 


间 中 进行 


在 齐 次 裁 


5.10 ”光栅 化 阶段 


光栅 化 阶段 (rasterization stage，RS， 亦 有 将 rasterization 译 作 像 素 
化 或 顶 格 化 ) 的 主要 任务 是 为 投影 至 屏幕 上 的 3D 三 角形 计算 出 对 应 的 
像素 颜色 。 


5.10.1 视 口 变换 


当 裁 剪 操 作 完成 之 后 ， 硬 件 会 通过 透视 除法 将 物体 从 齐 次 裁剪 空间 
变换 为 规格 化 设备 坐标 (NDC) 。 一 旦 物体 的 顶点 位 于 NDC 空 间 内 ， 
构成 2D 图 像 的 2D 顶 点 z、y% 坐 标 就 会 被 变换 到 后 台 缓 冲 区 中 称 为 视 口 
(viewport) 的 和 矩形 里 (回顾 4.3.9 节 )〉， 。 待 此 变换 完成 后 ， 这 些 rz、y 坐 
标 都 将 以 像素 为 单位 表示 。 通 常 来 讲 ， 由 于 :坐标 常 在 深度 缓冲 技术 中 
用 作 深 度 值 ， 因 此 视 口 变换 是 不 会 影响 此 值 的 。 即 便 如 此 ， 我 们 还 是 可 
以 通过 修改 D3D12_VIEWPORT 结 构 体 中 的 MinDepth 和 MaxDepth 值 来 做 
到 这 一 点 。 届 时 ， 我 们 只 需 保 证 MinDepth 和 MaxDepth 的 取 值 为 0 一 1 即 
Ws 





5.10.2 ”背面 剔除 


每 个 三 角形 都 有 两 个 面 ， 我 们 采用 以 下 约定 来 对 它们 进行 区 分 。 如 
果 组 成 三 角形 的 顶点 顺序 为 wo、2z1、zvw2， 那 么 ， 我 们 通过 下 述 方法 来 计 
算 此 三 角形 的 法 线 n: 


c0 三 V1 一 VO 





cl 二 V2 一 VO 
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法 向 量 [ 志 由 正面 (front side) 射出 ， 另 一 面 则 为 背面 (back 
side) 。 图 5.30 详 细 说 明了 这 一 点 。 


nD 








图 5.30 ”从 我 们 的 视角 来 看 ， 左 侧 的 三 角形 为 正面 朝 辣 ， 右 侧 的 三 角形 为 背面 明 向 

















如 末 观 察 者 看 到 的 是 三 角形 的 正面 ， 我 们 就 称 此 三 角形 是 正面 胃癌 
Cfront-facing) 的 ;如 果 观 察 者 看 到 的 是 三 角形 的 背面 ， 则 称 此 三 角形 
是 背面 胃癌 〈back-facing) 的。 从 我 们 的 视角 来 看 ， 图 5.30 中 左 侧 三 角 
形 为 正面 朝向 ， 右 侧 三 角形 为 背面 朝 癌 。 此 外 ， 根 据 我 们 的 视角 看 来 ， 
组 成 左 侧 三 角形 的 顶点 顺序 为 顺 时 针 方 向 ， 而 右 侧 三 角形 的 顶点 顺序 为 
逆 时 针 方 向 。 此 现象 绝 非 巧合 : 在 我 们 选择 的 这 种 约定 当中 《也 就 是 计 
算 三 角形 法 线 的 方法 ) ， 根 据 观 察 者 的 视角 看 去 ， 顶 点 绕 序 为 顺 时 针 方 
各 的 三 角形 为 正面 朝 辣 ， 而 顶点 绕 序 为 逆 时 针 方 向 的 三 角形 为 背面 霄 
回 。 

















就 目前 我 们 押 遇 到 的 情况 而 言 ， 大 多 数位 于 3D 世 界 空间 中 的 物体 
皆 为 实体 对 象 (solid object， 上 共有 边界 、 表 面 和 体积 的 对 象 ， 除 此 之 外 
还 有 线 框 对 象 等 。) 。 假 设 依 上 述 约 定 ， 令 构建 每 个 物体 所 用 都 是 法 线 


指 问 外 侧 的 三 角形 ， 那 么 摄像 机 将 看 不 到 实体 对 象 中 背面 朝 同 的 三 角 

形 ， 这 是 因为 正面 萌 向 的 三 角形 会 把 背面 朝 辐 的 三 角形 遮挡 起 来 。 图 

5.31 和 图 5.32 分 别 从 2D 和 3D 的 视角 展示 了 这 种 现象 。 由 于 背面 朝向 的 三 
角形 都 被 正面 朝 辐 的 三 角形 所 遮挡 ， 所 以 绘制 它们 是 没有 意义 的 。 背 面 
别 除 〈backface culling， 也 称 背 面 消 隐 ) 就 是 用 于 将 背面 划 同 的 三 角形 
从 演 染 流水 线 中 除去 的 处 理 流程 。 这 种 操作 能 将 竺 处理 的 三 角形 总 量 削 
减 一 半 。 
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图 5.31 图 a 中 ， 一 个 由 正面 朝向 三 角形 和 背面 朝向 三 角形 所 构成 的 实体 对 象 。 图 b 中 ， 展 示 的 
是 剔除 掉 背 面 朝 向 三 角形 的 效果 。 注 意 ， 背 面 剔 除 技术 并 不 会 影响 最 终 显 示 的 图 像 ， 这 是 因为 
背面 朝向 的 三 角形 都 被 正面 昌 向 的 三 角形 遮挡 住 了 





























在 默认 的 情况 下 ，Direct3D 将 以 观察 者 的 视角 把 顺 时 针 绕 序 的 三 角 
形 看 作 正 面 朝 癌 ， 把 逆 时 针 绕 序 的 三 角形 当 作 背面 朝 癌 。 但 是 ， 通 过 对 
Direct3D 演 染 状 态 的 设置 ， 我 们 也 可 以 将 这 个 约定 “颠倒 ”过 来 。 








留 | 


图 5.32 左 图 中 ， 我 们 以 透视 的 方式 来 绘制 立方 体 ， 因 此 能 将 它 的 6 个 面 一 览 无 遗 右 图 中 ， 我 们 

以 实体 模式 来 绘制 立方 体 。 注 意 ， 由 于 3 个 背面 朝向 的 面 被 3 个 正面 朝 辐 的 面 所 遮挡 ， 所 以 我 们 

是 看 不 到 它们 的 一 一 这 就 是 说 ， 我 们 可 以 在 观察 者 察觉 不 到 的 情况 下 ， 从 后 续 的 处 理 流程 中 丢 
弃 掉 背面 朝 疝 的 三 角形 



































5.10.3 ”顶点 属性 插值 





回顾 前 文 可 知 ， 我 们 要 通过 指定 顶点 来 定义 三 角形 。 除 了 位 置信 息 
以 外 ， 我 们 还 能 给 顶点 附加 颜色 、 法 向 量 和 纹理 坐标 等 其 他 属性 。 经 过 
视 口 变 换 之 后 ， 我 们 需要 为 求 取 三 角形 内 诸 像 素 所 附 的 属性 而 进行 插值 
(interpolate， 也 有 译作 内 插 ) 运算 。 而 且 ， 除 了 上 述 顶 点 属性 ， 还 需 
对 顶点 的 深度 值 进 行内 插 ， 继 而 得 到 每 个 像素 参与 实现 深度 缓冲 算法 的 
深度 值 。 为 了 得 到 屏幕 空间 (screen space， 即 将 3D 场 景 泻 染 为 最 终 图 
像 的 2D 空 间 〉 中 各 个 顶点 的 插值 属性 ， 往 往 要 通过 一 种 名 为 透视 校正 
插值 (perspective correct interpolation ) 的 方法 ， 对 3D 空 间 中 三 角形 的 属 
性 进行 线性 插值 〈 见 图 5.33) 。 从 本 质 上 来 说 ， 插 值 法 即 利用 三 角形 顶 
点 的 属性 值 计 算出 其 内 部 像素 的 属性 值 。 

















观察 点 RE p(s,t) =vo+sSs(C — vo)+t(v2 一 "0) 
其 中 , s 宇 0,t==0,s+t <1 




















图 5.33 ”通过 对 图 中 三 角形 上 3 个 顶点 的 属性 进行 线性 插值 ， 即 可 求 出 该 三 角形 内 任 
有 的 属性 值 P(5, 如 
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点 所 具 











bE 


我 们 无 须 考 虑 透视 校正 插值 法 处 理 像素 属性 的 具体 数学 细节 ， 因 为 
人 硬件 会 自动 完成 相应 的 处 理 。 对 此 感 兴趣 的 读者 可 以 从 [Eberly01] 中 找 
到 相应 的 数学 推导 过 程 。 在 此 ， 仪 借 图 5.34 给 出 此 插值 法 的 基本 思路 。 


























图 5.34 ”将 一 条 3D 线 段 投 影 到 投影 窗口 上 的 过 程 ( 该 3D 线 段 在 屏幕 空间 中 的 投影 实 为 一 条 2D 线 

段 ) 。 可 以 看 到 ， 在 观察 空间 里 ， 与 分 段 均 匀 的 3D 线 段 所 对 应 的 却 可 能 是 一 条 有 着 非 均 匀 步 长 

的 2D 线 段 。 由 此 可 见 ， 如 果 我 们 在 3D 空 间 中 执行 的 是 线性 插值 ， 那 么 在 屏幕 空间 里 则 要 进行 非 
线性 插值 














5.11 像 系 着 色 人 右 阶 段 


我 们 编写 的 像素 着 色 器 (pixel shader，PS) 是 一 种 由 GPU 来 执行 的 
程序 。 它 会 针对 每 一 个 像素 片段 (pixel fragment， 亦 有 译作 片 元 ) 进行 
处 理 〈( 即 每 处 理 一 个 像素 就 要 执行 一 次 像素 着 色 器 〉 ， 并 根据 顶点 的 插 
值 属性 作为 输入 来 计算 出 对 应 的 像素 颜色 。 像 素 着 色 器 既 可 以 直接 返回 
一 种 单一 的 恒定 颜色 ， 也 可 以 实现 如 逐 像素 光照 〈per-pixel lighting) 、 
反射 〈reflection) 以 及 阴影 (shadow) 等 更 为 复杂 的 效果 。 


5.12 输出 合并 阶段 


通过 像素 着 色 器 生成 的 像素 片段 会 锐 移 送 至 洽 染 流水 线 的 输出 合并 
(Output Merger，OM) 阶段 。 在 此 阶段 中 ， 一 些 像素 片段 可 能 会 被 丢 
和 莽 《〈 例 如 ， 那 些 未 通过 深度 缓冲 区 测试 或 模板 缓冲 区 测试 的 像素 片 
段 ) 。 而 后 ， 剩 下 的 像素 片段 将 会 被 写 入 后 全 缓冲 区 中 。 混 合 
blend， 也 有 译作 融合 ) 操作 也 是 在 此 阶段 实现 的 ， 此 技术 可 令 当 前 
处 理 的 像素 与 后 台 绥 冲 区 中 的 对 应 像素 相 融 合 ， 而 不 仅 是 对 后 者 进行 完 
全 的 履 写 。 一 些 如 “透明 ”这 样 的 特殊 效果 ， 也 是 由 混合 技术 来 实现 的 。 
我 们 会 在 第 10 章 中 专门 讲解 这 项 技术 。 











5.13 小结 


1. 根据 人 们 在 真实 生活 中 观 穴 物 体 的 经验 ， 我 们 可 以 总 结 出 一 些 
规律 。 运 用 这 些 规 律 ， 我 们 便 可 以 通过 2D 图 像 模拟 出 3D 效 果 的 场景 。 
我 们 可 以 观 罕 到 的 规律 有 : 平行 线 会 聚 于 消失 点 ， 物 体 的 矿 寸 受 其 深度 
的 影响 〈 近 大 远 小 ) ， 离 观察 者 近 的 物体 会 遮挡 其 后 距 观察 者 远 的 物 
体 ， 光 照 与 阴影 的 明暗 对 比 可 刻画 出 3D 物 体 的 实体 形状 和 体积 感 ， 阴 
影 还 暗示 了 光源 的 位 置 ， 并 反映 出 场景 中 不 同 物体 之 间 的 相对 位 置 。 





2. 我 们 用 三 角形 网 格 来 近似 地 表示 物体 。 并 通过 指定 三 角形 的 3 
个 顶点 来 定义 三 角形 。 在 许多 网 格 中 都 存在 着 顶点 被 不 同 三 角形 所 共用 
的 现象 ， 而 索引 列表 则 可 以 用 于 避免 因 重 复 使 用 顶点 而 复制 顶点 数据 所 
之 来 的 元 余 信息 。 





3. 我 们 可 以 通过 指定 红 、 绿 、 蓝 三 色光 的 强度 来 描述 颜色 。 利 用 
此 三 色光 不 同 强 度 的 相 加 混 色 (additive mixing， 也 称 加 色 法 ) ， 可 以 
使 我 们 表示 出 数 以 千 万 计 的 颜色 。 我 们 通常 用 归 一 化 范围 0 一 1 来 描述 三 
色 的 强度 ，0 表 示 没 有 强度 ，1 表 示 最 高 强度 ， 两 者 之 间 的 值 表示 相应 的 
中 间 强 度 。 一 般 来 说 还 会 加 入 男 一 种 名 为 alpha 分 量 (alpha 
component) 的 颜色 分 量 。alpha 分 量 通 铝 用 于 表示 颜色 的 不 透明 度 ， 这 
在 混合 技术 中 是 很 有 用 的 。 Wor 我 们 就 能 用 4D 颜 色 向 量 ( 
99 来 表示 颜色 ， 其 中 0 7,9,8,4a < 1。 由 于 需要 用 4D 疝 量 来 描述 颜 
色 数 据 ， 所 以 我 们 也 就 能 用 XMVECTOR 类 型 在 代码 中 表示 颜色 。 而 且 ， 
在 使 用 DirectXMath 向 量 函 数 进行 颜色 值 运算 时 ， 我 们 还 可 从 SIMD 技 术 











中 受益 。 为 了 能 用 32 位 数据 〈32-bits) 来 表示 颜色 ， 每 一 个 分 量 都 将 被 
分 配 1 字 节 ; DirectXMath 库 提供 了 XMCOLOR 结 构 体 来 存储 32 位 颜色 值 。 

在 计算 颜色 向 量 的 加 法 、 减 法 和 标量 乘法 时 ， 除 了 需要 将 分 量 钳制 在 区 
间 [0, 1] (对 32 位 颜色 来 说 区 间 为 [0, 255]) 之 中 ， 其 余 都 与 普通 向 量 的 

运算 相同 。 而 其 他 诸如 “点 积 ”“ 又 积 ” 这 样 的 癌 量 运 算 ， 对 颜色 癌 量 而 言 
都 是 没有 意义 的 。 此 外 ， 符 写 @ 表 示 分 量 式 乘法 ， 它 的 定义 为 


(cl, C2, C3,C4) 2 ( 大 1 .大 2 大 3 ks) 一 (cik1, coho, C3k3, C4ha), 











4. 给 出 菜 个 3D 场 景 的 几何 描述 ， 并 在 此 场景 中 设置 一 台 具 有 特定 
位 置 与 朝向 的 虚拟 摄像 机 ， 那 么 泻 染 污水 线 (rendering pipeline) 就 是 
根据 该 虚拟 摄像 机 的 视角 ， 生 成 能 呈现 在 显示 器 中 对 应 2D 图 像 的 这 一 


系列 完整 步骤 。 





5. 泻 染 流水 线 可 以 划分 为 输入 装配 〈Input Assembly，IA) 阶段 、 
顶点 着 色 器 (Vertex Shader，VS) 阶段 、 曲 面 细 分 (tessellation〉 阶 
段 、 几 何 着 色 器 〈Geometry Shader，GS) 阶段 、 裁 前 阶段 、 光 栅 化 阶 
段 (Rasterization Shage，RS) 、 像 过 着色 器 (Pixel Shader，PS) 阶段 
以 及 输出 合并 (Output Merger，OM) 等 重要 阶段 。 


5.14 练习 





1. 构建 图 5.35 中 “金字 塔 * 的 顶点 列表 和 索引 列表 。 


2. 考虑 图 5.36 中 列 出 的 两 个 几何 图 形 。 将 这 两 种 图 形 的 顶点 列表 
和 索引 列表 分 别 合 并 为 一 个 项 点 列表 和 一 个 索引 列表 实现 的 过 程 中 要 
注意 : 将 第 二 个 索引 列表 退 加 到 第 一 个 索引 列表 之 时 ， 还 需要 对 这 些 妃 
加 的 索引 值 进行 更 新 。 这 是 因为 第 二 个 索引 列表 中 的 原 索 引 值 所 引用 的 
仍 是 第 二 个 项 点 列表 中 的 顶点 ， 而 不 是 合并 后 顶点 列表 中 的 顶点 ) 。 





3. 在 世界 坐标 系 中 ， 假 设 一 台 位 于 (-20, 35, -50) 的 虚拟 摄像 机 正 
对 准点 (10, 0, 30) 进 行 观察 ， 并 且 已 知 描述 向 上 方向 的 向 量 为 (0, 1, 0)。 
计算 此 摄像 机 的 观察 矩阵 。 








4. 现 给 出 一 视 锥 体 ， 其 垂直 视 场 角 9 = 45"， 纵 横 比 "为 "= 4 3， 近 
平面 为 % = 1， 远 平面 为 1 = 100。 求 出 此 视 锥 体 对 应 的 透视 投影 矩阵 。 





图 5.35 “构成 四 棱锥 所 用 的 多 个 三 角形 











v3 
(a) (b) 


图 5.36 ”练习 2 所 用 的 几何 图 形 








5. 假设 观察 窗口 的 高 度 为 4。 求 出 当 垂 直 视 场 角 为 6 = 60" 时 ， 从 原 
点 到 此 观察 窗口 的 距离 d。 


6. 考虑 下 列 透视 投影 矩阵 : 


1.80003 0 0 0 
0 3.73205 0 0 
0 0 1.02564 1 
0 0 —5.12821 0 


求 出 构建 此 和 矩阵 所 用 的 垂直 视 场 角 a、 纵 横 比 + 以 及 远 、 近 平面 的 
值 。 





7. 给 出 含有 4 个 固定 值 4、B、C、D 的 透视 投影 算 阵 如 下 : 


4 0 0 0 
0 B 0 0 
0 0 C 1 
0 0 D0 


求 出 以 4、B、C、DD 表 示 的 构建 此 矩阵 所 用 的 垂直 视 场 角 a、 纵 横 
比 r 以 及 远 、 近 平面 的 距离 值 。 即 求解 下 列 方程 : 


1 
= 一 一 
(a) rtan(a/2) 





1 
的 一 一 
(b) tanla/2) 











mm 上 
(Cc) f =n 

D = 二 2 
(d) f—n 





借助 这 些 方程 的 解 ， 我 们 就 可 得 到 表示 本 书 中 任意 透视 投影 矩阵 的 
垂直 视 场 角 a、 纵 横 比 r 以 及 远 、 近 平面 的 公式 。 


8. 对 于 投影 纹理 算法 (projective texturing algorithm， 也 作 
projective texture mapping〉 来 说 ， 我 们 在 完成 投影 变换 之 后 还 要 为 之 乘 
上 一 个 仿 射 变换 矩阵 下 。 验 证 : 透视 除法 与 乘 以 惩 阵 开 的 运算 顺序 不 影 
啊 计 算 结果 。 设 为 一 个 4D 向 量 ， 书 为 一 个 投影 矩阵 ，T 为 一 个 4 x 4 的 
仿 射 变换 矩阵 ， 且 下 标 w 表 示 4D 同 量 的 ww 坐标 ， 证 明 : 


vP T (vw PT,) 
(vP), (PT), 


9. 证 明 投 影 矩 阵 的 逆 矩 阵 为 : 











rtan ($) 0 0 0 
0 tan($) 0 0 
0 1 
0 0 1 = 


10. 设 7,y*,1 为 观察 空间 中 的 某 点 坐标 ， 而 且 此 点 在 NDC 空 间 中 


的 坐标 为 Yndes ynac znde; HJ。 证 明 我 们 能 通过 以 下 方法 将 该 点 从 NDC 空 间 
变换 到 观察 空间 : 


. 1 se 
En Hd ie Bn? 1] 2 | 这 [2， 1] 


解释 我 们 为 什么 还 需要 除 以 w。 如 果 是 把 此 点 从 齐 次 裁 甬 空间 变换 
到 观察 空间 ， 还 需 除 以 w 吗 ? 





11， 描述 视 锥 体 的 另 一 种 方法 是 指定 其 近 平面 处 的 宽 和 高 。 如 若 给 
出 一 个 近 平 面 为 +*、 远 平面 为 /， 而 且 近 平面 处 宽 为 wu、 高 为 h 的 视 锥 体 ， 
a ee 


12. 给 出 一 个 视 锥 体 ， 其 垂直 视 场 角 为 9， 纵 横 比 为 4。， 近 平面 为 n 
， 远 平面 为 1。 求 该 视 锥 体 的 8 个 顶点 坐标 。 


13. 考虑 由 公式 ?mm {ZT,Yy,z) = (I+ ztr,Yy + ty, z ) 给 出 的 3D 前 切 变换 
(shear transform， 亦 称 错 切 变 换 ) 。 变 换 过 程 详 见 图 5.37。 证 明 此 线性 
变换 可 由 以 下 矩阵 来 表示 : 


14. 思考 平面 > = 1 内 的 3D 把 ， 即 所 有 可 由 坐标 \7,y, 来 统一 表示 的 


点 。 从 上 一 习题 中 对 点 (7,y, 1) 进 行 的 剪 切 变换 Szy 可 以 看 出 ， 其 效果 就 如 
同 对 平面 > = 1 中 的 所 有 点 执行 了 一 次 2D 平 移 操作 : 








图 5.37 ZK、y 坐 标 随 z 坐 标 发 生 剪 切 变换 。 图 中 长 方 体 的 上 表面 位 于 平面 2 二 1 内 。 
经 观察 可 知 ， 剪 切 变 换 对 此 平面 上 的 点 逐一 进行 了 平移 


1] 0 0 
ZHI0 1 0|=[r+t, y+ty, 1 


tr t, 1 














事实 上 ， 我 们 也 可 以 运用 3D 坐 标 来 编写 2D 应 用 程序 ， 但 此 时 处 理 
的 将 总 是 > = 1 这 一 平面 内 的 2D 空 间 。 接 下 来 ， 我 们 就 可 以 用 ?在 2D 空 
间 中 实现 平移 操作 。 


基于 上 述 讨 论 ， 即 可 推广 出 以 下 结论 : 


(a) 正如 3D 空 间 中 的 平面 是 一 个 2D 空 间 一 般 ，4D 空 间 中 的 平面 实 
为 一 个 3D 空 间 。 当 我 们 用 齐 次 坐标 (7,;y,?,1) 表 示 点 时 ， 其 实 是 在 处 理 4D 
平面 w = 1 这 一 3D 空 间 中 的 点 。 


(b) 平移 怎 阵 是 4D 甬 切 变换 
Szy:(T,Y, 2 Ww) = (T+ wt y+ why, z+ wt:, 山 的 矩阵 表示 。 4D 前 切 变 换 会 
对 平面 w = 1 内 的 点 实现 平移 的 效果 。 

















[1] 亦 有 译作 演 染 管道 、 泻 染 管线 、 绘 制 流水 线 等 。 有 时 也 称 之 为 图 形 
流水 线 ， 即 graphics pipeline。 不 管 何 种 译 法 ， 和 希望 会 给 读者 这 样 一 个 印 
象 : 把 泻 染 流水 线 想象 为 一 个 工厂 里 的 流水 线 ， 里 面 有 不 同 的 加 工 环节 
《也 就 是 泻 染 阶段 } ， 可 以 根据 用 户 需求 对 每 个 环节 灵活 改造 或 拆 番 

(可 编程 流水 线 ， 程 序 员 可 在 不 同 的 着 色 器 中 编写 自 定义 的 函数 ， 早 期 
均 为 固定 功能 流水 线 ， 后 加 入 可 编程 处 理 器 予以 实现 。 以 及 开启 或 禁用 
某 些 演 染 阶段 ， 如 曲面 细 分 阶段 与 几何 着 色 器 阶段 等 ) 。 以 此 把 原始 材 
料 〈CPU 端 向 GPU 端 提交 的 纹理 等 资源 以 及 指令 等 ) 加 工 为 成 品 出 售 给 
消费 者 〈 在 GPU 端 ， 资 源流 经 流水 线 里 的 各 个 阶段 ， 经 指令 的 调度 对 其 
进行 处 理 ， 最 终 计算 出 像素 的 颜色 ， 将 其 呈现 在 用 户 屏 幕 上 ) 。 事 实 

上 上 ， 泻 染 流 水 线 是 种 模型 ， 将 3D 场 景 变换 至 2D 场 景 的 处 理 流程 抽象 分 
离 为 不 同 的 流水 线 阶段 ， 供 用 户 使 用 。 其 本 质 即 指令 从 CPU 端的 应 用 程 
序 层 及 送 至 Direct3D 运 行 时 、 驱 动 层 及 至 GPU 端 《〈 包 括 二 者 间 的 通信 ， 

连接 都 靠 PCIe 接 口 ， 实 质 上 就 是 围绕 这 种 总 线 传 递 数 据 ) ， 资 源 数 据 在 
内 存 与 显存 间 游 走 ， 最 后 是 GPU 内 部 各 种 引擎 、 缓 存 、 命 令 队 列 等 根据 
指令 配合 运作 将 数据 转化 为 显示 器 可 视 信 号。 








[2] 此 处 的 “实体 ?可 以 理解 为 "实心 物体 ”之 意 ， 绘 图 模式 〈 或 模型 ) 可 
划分 为 “实体 ”与 “ 线 框 ”两 种 。 


[3] 已 被 Autodesk 收 入 上 时 中 。 
[4] 可 以 尝试 在 彩色 显示 器 的 屏 间 上 点 一 个 小 水 球 ， 并 查看 效果 。 


[5] 准确 来 说 ，alpha 通 道 仅 用 于 指示 颜色 的 透明 程度 ，alpha 本 身 并 无 


透明 或 不 透明 之 意 ， 文 中 说 的 也 很 清楚 。 


[6] DirectXMath 库 时 有 更 新 ， 所 以 本 书 的 代码 可 能 会 与 最 新 的 代码 有 
细小 差异 ， 但 是 功能 和 基本 结构 均 保 持 不 变 。 


[7] 意 即 构造 器 的 输入 参数 为 4 个 [0, 1] 区 间 内 的 浮 点 分 量 ， 经 过 实例 化 
后 ， 便 会 将 分 量 转 换 至 [0, 255] 区 间 。 


[8] 在 DirectX 12 中 ， 图 5.13d 里 三 角形 带 的 实际 环绕 顺序 为 ，012、 
132、234、354 等 〈 详 见 《Primitive Topologies》 (bb205124) 或 
《Triangle Strips》 〈bb206274) ) 。 近 道理 来 讲 ， 次 序 为 偶数 的 三 角形 
的 顶点 绕 序 也 应 遵循 默认 的 顶点 编写 顺序 (如 第 >、4 个 三 角形 的 默认 顶 
点 编号 顺序 应 为 123、345) ， 但 事实 上 并 非 如 此 。 为 什么 要 这 样 做 呢 ? 
作者 讲 到 : 为 了 使 绕 序 保持 一 致 ， 都 为 顺 时 针 。 而 绕 序 又 与 5.10.2 节 中 
所 述 的 剔除 搁 术 有 关 。 《这 样 来 看 ， 作 者 似乎 把 偶数 三 角形 中 要 调换 的 
顶点 理解 错 了 ， 在 DirectX 中 “置换 ”的 是 后 两 个 顶点 的 顺序 ， 而 在 
OpenGL 里 “置换 ”的 才 是 前 两 个 顶点 的 顺序 。) 


[9] 每 个 图 形 适 配器 部 具有 特定 大 小 的 缓存 (cache〉， 刚 处 理 过 的 项 
点 可 以 被 临时 存储 在 缓存 当中 ， 由 于 缓存 的 读 取 速度 较 顶 点 绥 冲 区 快 ， 
因此 可 以 利用 这 一 点 来 提升 软件 的 性 能 。 不 同 硬件 的 缓存 大 小 有 别 ， 因 
此 应 安排 好 顶点 顺序 ， 首 先 引用 需要 复 用 的 顶点， 在 这 些 顶 点 仍 位 于 组 
存 之 中 时 尽快 引用 。 








[10] 简单 来 讲 ， 局 部 坐标 系 、 依 目标 物体 而 建 〈 局 部 ); 世界 坐标 系 
是 物体 相对 于 它 来 定 方位 (全 局 》。 





[11] 从 上 下 文 来 看 ， 本 书 中 的 法 线 (normal〉 和 法 癌 量 (normal 


vector) 指 的 是 同一 概念 。 





第 6 章 ”利用 Direct3D 绘 制 几 何 体 


在 第 5 章 中 ， 我 们 几乎 把 全 部 的 注意 力 都 集中 在 泻 染 流水 线 的 概念 
及 其 相关 的 数学 知识 之 上 。 在 本 章 中 ， 我 们 将 关注 配置 演 染 流水 线 的 
Direct3D API 接 口 与 方法 、 定 义 顶 点 着 色 占 和 像素 着 色 器 并 将 几何 体 提 
交 至 演 染 流水 线 进行 绘制 。 完 成 本 章 的 学 习 后 ， 我 们 将 能 以 实体 着 色 
(solid coloring) 模式 或 在 线 框 模式 (wireframe mode) 下 绘制 一 个 3D 
Ws 





学 习 目 标 : 


1. 探索 用 于 定义 、 存 储 和 绘制 几何 体 数据 的 Direct3D 接 口 与 方 
法 。 


2. 学 习 编 写 人 简单 的 项 点 厦 色 器 和 像素 着 色 强 。 
3. 了 解 如 何 用 泻 染 流 水 线 状态 对 象 来 配置 泻 染 流水 线 。 


4. 理解 怎样 创建 常量 缓冲 区 数据 ， 并 将 其 绑 定 到 演 染 流水 线 上 。 
掌握 根 签名 的 用 法 。 


6.1 顶点 与 输入 布局 


回顾 5.5.1 节 可 知 ， 除 了 空间 位 置 ，Direct3D 中 的 顶点 还 可 以 存储 其 
他 属性 数据 。 为 了 构建 自 定义 的 顶点 格式 ， 我 们 首先 要 创建 一 个 结构 体 
来 容纳 选 定 的 顶点 数据 。 例 如 ， 下 面 列 出 了 两 种 不 同类 型 的 顶点 格式 : 
一 种 由 位 置 和 颜色 信息 组 成 ， 另 一 种 则 由 位 置 、 法 向 量 以 及 两 组 2D 纹 
理 坐 标 构成 。 





struct Vertexl 


XMFLOAT3 Pos; 
XMFLOAT4 Color; 


}; 


struct Vertex2 


XMFLOAT3 Pos; 
XMFLOAT3 Normal; 
XMFLOAT2 Tex®; 
XMFLOAT2 TeX1; 


}; 





定义 了 顶点 结构 体 之 后 ， 我 们 还 需要 问 Direct3D 提 供 该 项 点 结构 体 
的 描述 ， 使 它 了 解 应 怎样 来 处 理 结构 体 中 的 每 个 成 员 。 用 户 提 供给 
Direct3D 的 这 种 描述 被 称 为 输入 布局 摘 述 〈input layout description ) ， 
用 结构 体 D3D12_INPUT_LAYOUT_DESC 来 表示 : 





typedef struct D3D12 INPUT LAYOUT_DESC 


const D3D12 INPUT_ ELEMENT DESC *pInputElementDescs; 
UINT NumElements; 
} D3D12 INPUT_LAYOUT_DESC; 





输入 布局 描述 实 由 两 部 分 组 成 : 即 一 个 以 
D3D12_INPUT_ELEMENT_DESC 元 素 构 成 的 数组 ， 以 及 一 个 表示 该 数组 中 
的 元 素数 量 的 整数 。 


D3D12_INPUT_ELEMENT_DESC 数 组 中 的 元 素 依 次 描述 了 顶点 结构 体 
中 所 对 应 的 成 员 。 这 就 是 说 ， 如 果 某 顶点 结构 体 中 有 两 个 成 员 ， 那 么 与 
之 对 应 的 D3D12_INPUT_ELEMENT_DESC 数 组 也 将 存 有 两 个 元 
素 。D3D12_INPUT_ELEMENT_DESC 结 构 体 的 定义 如 下 : 











typedef struct D3D12 INPUT_ELEMENT_DESC 
{ 

LPCSTR SemanticName; 

UINT SemanticIndex; 

DXGI_ FORMAT Format; 


UINT InputSlot; 
UINT AlignedByteOffset; 
D3D12 INPUT_CLASSIFICATION InputSlotClass; 
UINT InstanceDataStepRate, 
} D3D12 INPUT_ ELEMENT_DESC; 





1. SemanticName: 一 个 与 元 系 相 关联 的 特定 字符 串 ， 我 们 称 之 为 
语义 (semantic) ， 它 传达 了 元 素 的 预期 用 途 。 该 参数 可 以 是 任意 合法 
的 语义 名 。 通 过 语义 即 可 将 顶点 结构 体 《〈 图 6.1 中 的 struct Vertex) 
中 的 元 素 与 顶点 着 色 器 输入 签名 [1 (vertex shader input signature， 即 图 
6.1 中 的 VertexOut VS 的 众 参数 ) 中 的 元 素 一 一 映射 起 来 ， 如 图 6.1 所 
示 1 


struct Vertex 


XMFLOAT3 Pos; 

XMFLOAT3 Normal; 

XMFLOAT2 Tex08; 

XMFLOAT2 Tex1; | | 


}; 
D3D12_INPUT_ELEMENT_DESC vertexDesc[] = 


{"POSITION", 8, DXGI_FORMAT_R32G32B32_FLOAT,， 08,，9@,，, 
D3D12_INPUT_ CLASSIFICATION _PER_VERTEX_DATA, 8@}, 
{"NORMAL", 8@, DXGI_FORMAT_R32G32B32_FLOAT, 86， 12, 
D3D12_INPUT_ CLASSIFICATION _PER_VERTEX_DATA, 8}, 
{"TEXCOORD", 8@, DXGI_FORMAT_R32G32_FLOAT, 8,， 24, 
D3D12_INPUT_ CLASSIFICATION_PER_VERTEX_DATA, 8}, 
{"TEXCOORD", 1, DXGI_FORMAT_R32G32_FLOAT, 98，32，, 
D3D12_INPUT_ CLASSIFICATION_PER_VERTEX_DATA, 8} 
}; 


VertexOut VS(float3 iPos : POSITION, 
float3 iNormal : NORMAL, 
float2 iTex@ : TEXCOORD6， 
float2 iTex1 : TEXCOORD1) 
图 6.1 D3D12_INPUT_ELEMENT_DESC 数 组 中 的 元 素 与 顶点 结构 体 中 的 成 员 一 一 对 应 ， 而 语义 名 
与 索引 则 为 顶点 元 素 映射 到 顶点 着 色 器 中 对 应 的 参数 提供 了 途径 











2. SemanticIndex: 附加 到 语义 上 的 索引 。 此 成 员 的 设计 动机 可 
从 图 6.1 中 看 出 。 例 如 ， 顶 点 结构 体 中 的 纹理 坐标 可 能 不 止 一 组 ， 而 仪 
在 语义 名 尾部 添加 一 个 索引 ， 即 可 在 不 引入 新 语义 名 的 情况 下 区 分 出 这 
两 组 不 同 的 纹理 坐标 。 在 着 色 器 代码 中 ， 未 标明 索引 的 语义 将 默认 其 索 
引 值 为 0， 也 就 是 说 ， 图 6.1 中 的 POSITION 与 POSITION6 等 价 。 


3. Format: 在 Direct3D 中 ， 要 通过 枚 举 类 型 DXGI_FORMAT 中 的 成 
员 来 指定 顶点 元 素 的 格式 〈 即 数据 类 型 ) 。 下 面 是 一 些 澡 用 的 格式 。 





DXGI_FORMAT_R32_FLOAT // 1D 32 位 浮 点 标量 

DXGI_FORMAT_R32G32_FLOAT // 2D 32 位 浮 点 向 量 
DXGI_FORMAT_R32G32B32_FLOAT // 3D 32 位 浮 点 向 量 
DXGI_FORMAT_R32G32B32A32_FLOAT // 4D 32 位 浮 点 向 量 








DXGI_FORMAT_R8_UINT // 1D 8 位 无 符号 整 型 标量 


DXGI_FORMAT_R16G16_SINT  // 2D 16 位 有 符号 整 型 向 量 
DXGI_FORMAT_R32G32B32_UINT // 3D 32 位 无 符号 整 型 向 量 
DXGI_FORMAT_R8G8B8A8_SINT // 4D 8 位 有 符号 整 型 向 量 





DXGI_FORMAT_R8G8B8A8_UINT // 4D 8 位 无 符号 整 型 向 量 





4. InputSlot: 指定 传递 元 素 所 用 的 输入 模 (input slot index) 索 
引 。Direct3D 共 文 持 16 个 输入 槽 《索引 值 为 0 一 15) ， 可 以 通过 它们 来 
向 输入 装配 阶段 传递 顶点 数据 。 目 前 我 们 只 会 用 到 输入 模 0《〈 即 所 有 的 
顶点 元 素 都 来 自 同一 个 输入 槽 )， 但 在 本 章 的 习题 2 中 将 会 涉及 多 输入 
槽 的 编程 实践 。 





5. AlignedByteOffset: 在 特定 输入 槽 中 ， 从 C++ 顶点 结构 体 的 
首 地 址 到 其 中 某 点 元 素 起 始 地 址 的 偏 移 量 ( 用 字 节 表示 〉。 例 如 ， 在 下 
列 顶 点 结构 体 中 ， 元 素 Pos 的 偏 移 量 为 0 字 节 ， 因 为 它 的 起 始 地 址 与 顶点 
结构 体 的 首 地 址 一 致 ， 元 素 Normal 的 偏 移 量 为 12 字 节 ， 因 为 跳 过 Pos 所 
占用 的 字 市 数 才能 找到 Normal 的 起 始 地 址 ， 元 素 Tex8 的 偏 移 量 为 24 字 
节 ， 因 为 跨 过 Pos 和 Normal 的 总 字 节 数 才 可 获取 Tex8@ 的 起 始 地 址 。 同 
理 ， 元 素 Tex1 的 偏 移 量 为 32 字 市 ， 只 有 跳 过 Pos、Normal 和 Tex8 这 3 个 
元 素 的 总 字 节 数 方 可 寻 得 Tex1 的 起 始 地 址 。 























struct Vertex2 


{ 
XMFLOAT3 Pos; ”// 偏 移 量 为 6 字 节 


XMFLOAT3 Normal; // 偏 移 量 为 12 字 节 
XMFLOAT2 Tex8; ”// 偏 移 量 为 24 字 节 
XMFLOAT2 Tex1; ”// 偏 移 量 为 32 字 节 

















6. InputSlotClass: 我 们 暂且 把 此 参数 指定 
为 D3D12_INPUT_CLASSIFICATION_PER_VERTEX_DATAP2J。 而 另 一 选项 


(D3D12_INPUT_CLASSIFICATION_PER_INSTANCE_DATAII) 则 用 于 实 
现实 例 化 (instancing) 这 种 高 级 技术 。 


7. InstanceDataStepRate: 目前 仅 将 此 值 指定 为 0。 知 要 采用 实 
例 化 这 种 高 级 技术 ， 则 将 此 参数 设 为 1。 


Y 


就 前 面 Vertex1 和 Vertex2 这 两 个 项 点 结 构 体 的 例子 来 说 ， 其 相应 
的 输入 布局 描述 为 : 


D3D12_INPUT_ELEMENT_DESC desc1[] = 
{ 
{ "POSITION"，6，DXGI_FORMAT_R32G32B32_FLOAT，6，6， 
D3D12_INPUT_CLASSIFICATION PER VERTEX DATA, 0}, 
{"COLOR", 0, DXGI_ FORMAT_ R32G32B32A32_FLOAT, 8,12， 
D3D12_ INPUT_CLASSIFICATION PER VERTEX DATA, 06} 


}; 


D3D12_INPUT_ELEMENT_DESC desc2[] = 
{ 
{"POSITION", 060, DXGI_ FORMAT R32G32B32_FLOAT, 8,，0,， 
D3D12_INPUT_CLASSIFICATION PER VERTEX _ DATA, 6}, 
{"NORMAL", 6，DXGI_FORMAT_R32G32B32_FLOAT，6，12， 
D3D12_INPUT_CLASSIFICATION PER VERTEX DATA, 0}, 
{"TEXCOORD", 0, DXGI_ FORMAT R32G32 FLOAT, 6，24， 
D3D12_ INPUT_CLASSIFICATION PER VERTEX DATA, 06} 
{"TEXCOORD", 1, DXGI_ FORMAT R32G32 _ FLOAT, 6，32， 
D3D12 INPUT_CLASSIFICATION PER VERTEX DATA, 06} 


}; 





6.2 ”顶点 绥 冲 区 


为 了 使 GPU 可 以 访问 顶点 数组 ， 束 需要 把 它们 放置 在 称 为 绥 冲 区 
Cbuffer) 的 GPU 资 源 (ID3D12Resource) 里 。 我 们 把 存储 顶点 的 缓冲 
区 叫 作 顶点 缓冲 区 (vertex buffer) 。 绥 冲 区 的 结构 比 纹理 更 为 简单 : 
既 非 多 维 资源 ， 也 不 支持 mipmap、 过 滤器 以 及 多 重 采 样 等 技术 。 当 需 
要 同 GPU 提 供 如 顶点 这 类 数据 元 素 所 构成 的 数组 时 ， 我 们 便 会 使 用 缓冲 
区 。 


就 像 在 4.3.8 节 中 所 做 的 那样 ， 我 们 先 通 过 填写 
D3D12_RESOURCE_DESC 结 构 体 来 描述 缓冲 区 资源 ， 接 着 再 调 
用 ID3D12Device: :CreateCommittedResource 方 法 去 创建 
ID3D12Resource 对 象 。 至 于 D3D12_RESOURCE_DESC 结 构 体 中 所 有 成 员 
的 介绍 ， 可 参考 4.3.8 节 。Direct3D 12 提 供 了 一 个 C++ 包装 
类 CD3DX12_RESOURCE_DESC， 它 派生 自 D3D12_RESOURCE_DESC 结 构 
体 ， 并 附 有 多 种 便于 使 用 的 构造 函数 以 及 方法 。 特 别 是 它 提供 的 下 列 方 
法 ， 一 种 简化 缓冲 区 描述 过 程 的 D3D12_RESOURCE_DESC 的 构造 函数 : 
static inline CD3DX12 RESOURCE DESC Buffer( 

UINT64 width, 

D3D12_RESOURCE_FLAGS flags = D3D12 RESOURCE_ FLAG NONE, 


UINT64 alignment = 6 ) 
{ 


return CD3DX12 RESOURCE DESC( D3D12 RESOURCE DIMENSION BUFFER, 
alignment, width, 1, 1, 1, 
DXGI_ FORMAT UNKNOWN, 1, ©, 
D3D12 TEXTURE LAYOUT_ROW MAJOR, flags ); 
} 





对 于 缓冲 区 而 言 ， 函 数 代码 中 的 width 即 表示 缓冲 区 中 所 占 的 字 节 
数 。 例 如 ， 若 缓冲 区 存储 了 64 个 float 类 型 的 数据 ， 那 么 width 的 值 即 
为 64*sizeof(float)。 


注 意 Note i 


除 此 之 外 ，CD3DX12_RESOURCE_DESC 类 还 提供 了 以 下 构建 
D3D12_RESOURCE_DESC 结 构 体 的 简便 方法 ， 用 于 描述 纹理 资源 及 其 可 
供 查 询 的 相关 信息 : 


1. CD3DX12 RESOURCE_ DESC: :Tex1D 
2. CD3DX12 RESOURCE_DESC: :Tex2D 


3. CD3DX12 RESOURCE_DESC: :Tex3D 


注 意 Note a 


我 们 在 第 4 章 中 曾 提 到 深度 /模板 缓冲 区 ， 它 是 一 种 以 
ID3D12Resource 对 象 表示 的 2D 纹 理 。 在 Direct3D 12 中 ， 所 有 的 资源 均 
用 ID3D12Resource 接 口 表 示 。 相 比 之 下 ，Direct3D 11 则 采用 如 
ID3D11Buffer 与 ID3D11Texture2D 等 多 种 不 同 的 接口 来 表示 各 种 不 同 


的 资源 。 而 且 ， 在 Direct3D 12 中 ， 资 源 的 类 型 

由 D3D12_RESOURCE_DESC: :D3D12_RESOURCE_DIMENSION 字 段 来 加 以 
区 分 。 例 如 ， 缓 冲 区 用 D3D12_RESOURCE_DIMENSION_BUFFER 类 型 表 
示 ， 而 2D 纹 理 则 以 D3D12_RESOURCE_DIMENSION_TEXTURE2D 类 型 表 


人 钞 。 


对 于 静态 几何 体 (static geometry， 即 每 一 帧 都 不 会 发 生 改 变 的 几何 
体 ) 而 言 ， 我 们 会 将 其 顶点 缓冲 区 置 于 默认 堆 
(D3D12_HEAP_TYPE_DEFAULT》 中 来 优化 性 能 。 一 般 说 来 ， 游 戏 中 的 
大 多 数 几何 体 ( 如 树木 、 建 筑 物 、 地 形 和 动画 角色 〉 都 是 如 此 处 理 。 在 
这 种 情况 下 ， 顶 点 缓冲 区 初始 化 完毕 后 ， 只 有 GPU 需要 从 其 中 读 取 数据 
来 绘制 几何 体 ， 所 以 使 用 默认 堆 是 很 明智 的 做 法 。 然 而 ， 如 果 CPU 不 能 
向 默认 堆 中 的 顶点 缓冲 区 写 入 数据 ， 那 么 我 们 该 如 何 初 始 化 此 顶点 缓冲 
区 呢 ? 


因此 ， 除 了 创建 顶点 缓冲 区 资源 本 身 之 外 ， 我 们 还 需 用 
D3D12_HEAP_TYPE_UPLOAD 这 种 堆 类 型 来 创建 一 个 处 于 中 介 位 置 的 上 传 
绥 冲 多 (upload buffer) 资源 。 在 4.3.8 节 里 ， 我 们 就 是 通过 把 资源 提交 
至 上 传 堆 ， 才 得 以 将 数据 从 CPU 复制 到 GPU 显存 中 。 在 创建 了 上 传 缓冲 
区 之 后 ， 我 们 就 可 以 将 顶点 数据 从 系统 内 存 复制 到 上 传 缓冲 区 ， 而 后 再 
把 顶点 数据 从 上 传 缓冲 区 复制 到 真正 的 顶点 缓冲 区 中 。 


由 于 我 们 需要 利用 作为 中 介 的 上 传 缓冲 区 来 初始 化 默认 缓冲 区 《〈 即 


用 堆 类 型 D3D12_HEAP_TYPE_DEFAULT 创 建 的 缓冲 区 ) 中 的 数据 ， 
此 ， 我 们 融 在 d3dUtilh/.cpp 文 件 中 构建 了 下 列 工 具 函 数 ， 以 避免 在 每 次 
使 用 默认 缓冲 区 时 再 做 这 些 重复 的 工作 。 





Microsoft: :WRL::Comptr d3dUtil::CreateDefaultBuffer( 
ID3D12Device* device, 
ID3D12GraphicsCommandList* cmdList， 
const void* initData, 
UINT64 byteSize, 
Microsoft: :WRL: :CompPtr& uploadBuffer) 


CompPtr defaultBuffer; 


// 创建 实际 的 默认 缓冲 区 资源 
ThrowIfFailed(device->CreateCommittedResource( 
&CD3DX12_HEAP_ PROPERTIES(D3D12 HEAP_TYPE_DEFAULT), 
D3D12_HEAP_FLAG NONE, 
&CD3DX12 RESOURCE DESC: :Buffer(byteSize), 
D3D12 RESOURCE_ STATE COMMON, 
nullptr, 
IID PPV_ARGS(defaultBuffer.GetAddressOof()))); 





站 // 为 了 将 CPU 端 内 存 中 的 数据 复制 到 默认 缓冲 区 ， 我 们 还 需要 创建 一 个 处 于 中 介 位 置 的 上 
堆 
ThrowIfFailed(device->CreateCommittedResource( 
&CD3DX12_ HEAP PROPERTIES(D3D12 HEAP TYPE_ UPLOAD), 
D3D12_HEAP_FLAG NONE, 
&CD3DX12 RESOURCE DESC: :Buffer(byteSize), 
D3D12 RESOURCE STATE_ GENERIC READ, 
nullptr, 
IID PPV_ARGS(uploadBuffer.GetAddressOof()))); 








// 描述 我 们 希望 复制 到 默认 缓冲 区 中 的 数据 

D3D12 SUBRESOURCE DATA subResourceData = {}; 
subResourceData.pData = initData; 
subResourceData.RowPitch = byteSize; 
subResourceData.Slicepitch = subResourceData.RowPitch ; 








// 将 数据 复制 到 默认 缓冲 区 资源 的 流程 

// Updatesubresources 辅 助 函 数 会 先 将 数据 从 CPU 端的 内 存 中 复制 到 位 于 中 介 位 置 的 上 
传 堆 里 接着 ， 

// 再 通过 调用 ID3D12CommandList: :CopySubresourceRegion 函 数 ， 把 上 传 堆 内 的 数据 
复制 到 

// mBuffer 中 [4] 












































cmdList->ResourceBarrier(1， 
&CD3DX12_RESOURCE_BARRIER: :Transition(defaultBuffer .Get()， 
D3D12 RESOURCE STATE COMMON, 
D3D12_ RESOURCE STATE COPY_DEST)); 
UpdateSubresources(cmdList, 
defaultBuffer.Get(), uploadBuffer.Get(), 
60, 0， 1, &subResourceData); 
cmdList->ResourceBarrier(1, 
&CD3DX12 RESOURCE BARRIER: :Transition(defaultBuffer .Get(), 
D3D12 RESOURCE STATE_ COPY_DEST, 
D3D12 RESOURCE STATE GENERIC READ)); 





// 注意 : 在 调用 上 述 函 数 后 ， 必 须 保证 uploadBuffer 依 然 存 在 ， 而 不 能 对 它 立即 进行 销 
毁 。 这 是 因为 

// 命令 列表 中 的 复制 操作 可 能 尚未 执行 。 待 调用 者 得 知 复制 完成 的 消息 后 ， 方 可 释放 up1 
oadBuffer 

















return defaultBuffer; 
} 





D3D12_SUBRESOURCE_DATA 结 构 体 的 定义 为 : 


typedef struct D3D12 SUBRESOURCE DATA 
{ 


const void *pData; 


LONG_ PTR RowPitch; 
LONG PTR Slicepitch; 
} D3D12 SUBRESOURCE_ DATA; 





1. pData: 指 癌 某 个 系统 内 存 块 的 指针 ， 其 中 有 初始 化 缓冲 区 所 
用 的 数据 。 如 果 欲 初始 化 的 缓冲 区 能 够 存储 n 个 顶点 数据 ， 则 该 系统 内 
存 块 必定 可 容纳 人 至少" 个 顶点 数据 ， 以 此 来 初始 化 整个 缓冲 区 。 





2. RowPitch: 对 于 缓冲 区 而 言 ， 此 参数 为 欲 复制 数据 的 字 节 数 。 


3. SlicePitch: 对 于 缓冲 区 而 言 ， 此 参数 亦 为 僻 复 制 数 据 的 字 市 
数 。 


下 面 的 代码 演示 了 此 类 将 如 何 创 建 存 有 立方 体 8 个 顶点 的 默认 缓冲 


区 ， 并 为 其 中 的 每 个 顶点 都 分 别 赋予 了 不 同 的 颜色 。 


Vertex vertices[] = 


{ 


{ XMFLOAT3(-1.6f, -1.6f, -1.6f), XMFLOAT4(Colors::White) }, 
{ XMFLOAT3(-1.6f，+1.6f，-1.6f)，XMFLOAT4(Colors::Black) }, 
{ XMFLOAT3(+1.6f，+1.6f，-1.6f)，XMFLOAT4(Colors::Red) }, 

{ XMFLOAT3(+1.6f， .of， .of)，XMFLOAT4(Colors::Green) }, 
{ XMFLOAT3(-1.6f，-1.6f，+1.6f)，XMFLOAT4(Colors::Blue) }， 

{ XMFLOAT3(-1.6f， .of， .of)，XMFLOAT4(Colors::Yellow) }， 
{ XMFLOAT3(+1.6f， .of， .of)，XMFLOAT4(Colors::Cyan) }, 


{ XMFLOAT3(+1.6f， .Of， .of)，XMFLOAT4(Colors::Magenta) } 
}; 


const UINT64 vbByteSize = 8 * sizeof(Vertex); 


CompPtr<ID3D12Resource> VertexBufferGPU = nullptr; 

CompPtr<ID3D12Resource> VertexBufferUploader = nullptr; 

VertexBufferGPU = d3dUtil::CreateDefaultBuffer(md3dDevice.Get(), 
mCommandList.Get(), vertices, vbByteSize, VertexBufferUploader); 





代码 中 的 Vertex 类 型 〈 即 顶点 的 坐标 及 其 颜色 ) 的 定义 如 下 。 


struct Vertex 


{ 


XMFLOAT3 Pos; 
XMFLOAT4 Color; 


}; 





为 了 将 顶点 缓冲 区 绑 定 到 演 染 流水 线 上 ， 我 们 需要 给 这 种 资源 创建 
ed 
view， 演 染 目标 视图 ) 不 同 的 是 ， 我 们 无 须 为 项 点 缓冲 区 视图 创建 描述 

符 堆 。 而 且 ， 顶 点 缓冲 区 视图 是 由 D3D12_VERTEX_BUFFER_VIEW 结构 


体 来 表示 。 








typedef struct D3D12 VERTEX BUFFER VIEW 


{ 
D3D12_GPU_VIRTUAL _ ADDRESS BufferLocation; 


UINT SizeInBytes; 
UINT StrideInBytes ; 
} D3D12 VERTEX_BUFFER_VIEW; 


1. BufferLocation: 竺 创建 视图 的 顶点 绥 冲 区 资源 虚拟 地 址 。 我 
们 可 以 通过 ID3D12Resource: :GetGPUVirtualAddress 方 法 来 获得 此 
地 址 。 


2. SizeInBytes: 竺 创建 视图 的 顶点 缓冲 区 大 小 《用 字 贡 表 
不 ) 。 


3. StrideInBytes: 每 个 顶点 元 素 所 占用 的 字 节 数 。 


在 顶点 缓冲 区 及 其 对 应 视图 创建 完成 后 ， 便 可 以 将 它 与 泻 染 流 水 线 
上 的 一 个 输入 槽 (input slot〉 相 绑 定 。 这 样 一 来 ， 我 们 就 能 同 流水 线 中 
的 输入 装配 器 阶段 传递 顶点 数据 了 。 此 操作 可 以 通过 下 列 方法 来 实现 。 


void ID3D12GraphicsCommandList::IASetVertexBuffers( 
UINT StartSlot, 


UINT NumView, 
const D3D12 VERTEX BUFFER VIEW *pViews); 





1. StartSlot: 在 绑 定 多 个 顶点 缓冲 区 时 ， 所 用 的 起 始 输 入 槽 
( 若 仅 有 一 个 顶点 缓冲 区 ， 则 将 其 绑 定 至 此 槽 ) 。 输 入 槽 共有 16 个 ， 索 
引 为 0 一 15。 


2. NumViews: 将 要 与 输入 槽 绑 定 的 顶点 缓冲 区 数量 〈“ 即 视图 数组 
pViews 中 视图 的 数量 ) 。 如 果 起 始 输入 槽 startslot 的 索引 值 为 5， 且 
我 们 要 绑 定 "个 顶点 缓冲 区 ， 那 么 这 些 缓冲 区 将 依次 与 输入 覃 


大 ;大 了 1 .大 二 1 相 绑 定 。 
3. pViews: 指 加 顶点 缓冲 区 视图 数组 中 第 一 个 元 素 的 指针 。 


下 面 是 该 函数 的 一 个 调用 示例 。 


D3D12 VERTEX BUFFER VIEW vbv; 
vbv.BufferLocation = VertexBufferGPU->GetGPUVirtualAddress(); 
vbv.StrideInBytes = sizeof(Vertex); 


vbv.SizeInBytes = 8 * sizeof(Vertex); 


D3D12 VERTEX_ BUFFER VIEW vertexBuffers[1] = { vbv }; 
mCommandList->IASetVertexBuffers(6, 1, vertexBuffers); 





由 于 IASetVertexBuffers 方 法 会 将 项 点 缓冲 区 数组 中 的 元 素 设 置 
到 不 同 的 输入 槽 上 去 ， 所 以 使 它 看 起 来 似乎 有 些 复杂 。 但 是 ， 在 我 们 的 
示例 中 实际 只 会 使 用 一 个 输入 槽 。 而 在 章 末 的 一 道 习 题 中 ， 我 们 将 体验 
到 运用 两 个 输入 槽 进行 绘制 的 过 程 。 








我 们 在 不 对 顶点 缓冲 区 进行 任何 修改 ， 它 就 将 一 直 被 绑 定 于 所 在 的 
输入 槽 上 。 上 所 以 ， 如 果 使 用 多 个 顶点 缓冲 区 ， 那 么 就 可 以 按 以 下 流程 来 
构建 代码 。 





ID3D12Resource* mVB1; // 存储 Vertex1 类 型 的 顶点 
ID3D12Resource* mVB2; // 存储 Vertex2 类 型 的 顶点 


I 








D3D12_VERTEX_BUFFER_VIEW mVBView1; // mVB1 的 视 区 
D3D12_VERTEX_BUFFER_VIEW mVBView2; // mVB2 的 视 区 





























创建 顶点 缓冲 区 及 其 视图 .….*/ 





mCommandList->IASetVertexBuffers(606, 1, &mVBView1); 
/* .使 用 顶点 缓冲 区 1 来 绘制 物体 … */ 


mCommandList->IASetVertexBuffers(606, 1, &mVBView2); 
/* .使 用 顶点 缓冲 区 2 来 绘制 物体 … */ 











将 顶点 缓冲 区 设置 到 输入 槽 上 并 不 会 对 其 执行 实际 的 绘制 操作 ， 而 
是 仅 为 项 点 数据 送 至 演 染 流水 线 做 好 准备 而 已 。 这 最 后 一 步 才 是 通过 
ID3D12GraphicsCommandList::DrawInstanced 方 法 上 真正 地 绘制 顶 
点 


/NO 











void ID3D12GraphicsCommandList::DrawInstanced ( 
UINT VerteXxCountPerInstance， 


UINT InstanceCount, 
UINT StartVertexLocation, 
UINT StartInstanceLocation); 





1. VertexCountPerInstance: 每 个 实例 要 绘制 的 顶点 数量 。 


2. InstanceCount: 用 于 实现 一 种 被 称 作 实例 化 (instancing) 的 
高 级 技术 。 就 目前 来 说 ， 我 们 只 绘制 一 个 实例 ， 因 而 将 此 参数 设置 为 
| 


3. StartVertexLocation: 指定 顶点 缓冲 区 内 第 一 个 被 绘制 顶点 
的 索引 〈 该 索引 值 以 0 为 基准 ) 。 


4. StartInstanceLocation: 用 于 实现 一 种 被 称 作 实例 化 的 高 级 
技术 ， 暂 时 只 需 将 其 设置 为 0。 


VertexCountPerInstance 和 StartVertexLocation 了 两 个 参数 定 
义 了 顶点 缓冲 区 中 将 要 被 绘制 的 一 组 连续 顶点 ， 如 图 6.2 所 示 。 


顶点 缓冲 区 的 内 存 





将 要 绘制 的 顶点 个 数 





起 始 项 点 的 位 置 








图 6.2 ”StartVertexLocation 参 数 指定 了 顶点 缓冲 区 中 第 一 个 被 绘制 顶点 的 索引 (此 索引 从 0 
开始 计 ) ，VertexCountPerInstance 指 定 了 欲 绘制 顶点 的 个 数 











既然 DrawInstanced 方 法 没有 指定 顶点 被 定义 为 何 种 图 元 ， 那 么 ， 
它们 应 该 被 绘制 为 点 、 线 列表 还 是 三 角形 列表 呢 ? 回顾 5.5.2 节 可 知 ， 图 
元 拓扑 状态 实 
由 ID3D12GraphicsCommandList::IASetPrimitiveTopology 方 法 来 
设置 。 下 面 给 出 一 个 相关 的 调用 示例 : 


cmdList->IASetPrimitiveTopology (D3D_PRIMITIVE TOPOLOGY_ TRIANGLELIST); 


6.3 ”索引 和 索引 缓冲 区 


与 顶点 相似 ， 为 了 使 GPU 可 以 访问 索引 数组 ， 就 需要 将 它们 放置 于 
GPU 的 缓冲 区 资源 (ID3D12Resource) 内 。 我 们 称 存储 索引 的 缓冲 区 
为 索引 缓冲 区 (index buffer) 。 由 于 本 书 所 采用 的 
d3dUtil::CreateDefaultBuffer 函 数 是 通过 void# 类 型 作为 参数 引入 
泛 型 数据 ， 这 融 意 味 着 我 们 也 可 以 用 此 函数 来 创建 索引 缓冲 区 《或 任意 
类 型 的 默认 缓冲 区 ) 。 





为 了 使 索引 缓冲 区 与 泻 染 流水 线 绑 定 ， 我 们 需要 给 索引 缓冲 区 资源 
创建 一 个 索引 缓冲 区 视图 (index buffer view) 。 如 同 顶 点 缓冲 区 视图 一 
样 ， 我 们 也 无 须 为 索引 缓冲 区 视图 创建 描述 符 堆 。 但 索引 绥 冲 区 视 岁 要 
由 结构 体 D3D12_INDEX_BUFFER_VIEW 来 表示 。 


typedef struct D3D12 INDEX BUFFER VIEW 


D3D12_GPU_VIRTUAL ADDRESS BufferLocation; 
UINT SizeInBytes; 
DXGI_ FORMAT Format; 

} D3D12 INDEX BUFFER VIEW; 





1. BufferLocation: 竺 创建 视图 的 索引 绥 冲 区 资源 虚拟 地 址 。 我 
们 可 以 通过 调用 ID3D12Resource: :GetGPUVirtualAddress 方 法 来 获 
取 此 地 址 。 


2. SizeInBytes: 竺 创建 视 岁 的 索引 缓冲 区 大 小 《以 字 节 表 
汞 ) 5 


3. Format: 索引 的 格式 必须 为 表示 16 位 索引 的 
DXGI_FORMAT_R16_UINT 类 型 ， 或 表示 32 位 索引 的 
DXGI_FORMAT_R32_UINT 类 型 。16 位 的 索引 可 以 减少 内 存 和 带宽 的 占 
用 ， 但 如 果 索 引 值 范围 超过 了 16 位 数据 的 表达 范围 ， 则 也 只 能 采用 32 位 
索 细 工 : 





与 顶点 绥 冲 区 相似 《也 包括 其 他 的 Direct3D 资 源 在 内 ) ， 在 使 用 之 
前 ， 我 们 需要 先 将 它们 绑 定 到 泻 染 流水 线 上 。 通 过 
ID3D12GraphicsCommandList::IASetIndexBuffer 方 法 即 可 将 索引 
缓冲 区 绑 定 到 输入 装配 器 阶段 。 下 面 的 代码 演示 了 怎样 创建 一 个 索引 组 
冲 区 来 定义 构成 立方 体 的 三 角形 ， 以 及 为 该 索引 缓冲 区 创建 视图 并 将 它 
绑 定 到 演 染 流水 线 : 








std: :uint16 t indices[] = { 





// 立方 体 前 表面 










































































const UINT ibByteSize = 36 * sizeof(std::uint16 七 ) ; 


CompPtr<ID3D12Resource> IndexBufferGPU = nullptr; 

CompPtr<ID3D12Resource> IndexBufferUploader = nul1ptr; 

IndexBufferGPU = d3dUtil::CreateDefaultBuffer(md3dDevice.Get(), 
mCommandList.Get(), indices, ibByteSize, IndexBufferUploader); 


D3D12 INDEX BUFFER VIEW ibyv; 

ibv.BufferLocation = IndexBufferGPU->GetGPUVirtualAddress(); 
ibv.Format = DXGI FORMAT R16 _UINT; 

ibv.SizeInBytes = ibByteSize; 


mCommandList->IASetIndexBuffer(&ibv ) ; 








最 后 需要 注意 的 是 ， 在 使 用 索引 的 时 候 ， 我 们 一 定 要 
用 ID3D12GraphicsCommandList::DrawIndexedInstanced 方 法 代 蔡 
DrawInstanced 方 法 进行 绘制 。 





void ID3D12GraphicsCommandList::DrawIndexedInstanced( 
UINT IndexCountPerInstance， 
UINT InstanceCount, 


UINT StartIndexLocation， 
INT BaseVertexLocation, 
UINT StartInstanceLocation); 





1. IndexCountPerInstance: 每 个 实例 将 要 绘制 的 索引 数量 。 


2. InstanceCount: 用 于 实现 一 种 被 称 作 实例 化 的 高 级 技术 。 就 
目前 而 言 ， 我 们 只 绘制 一 个 实例 ， 因 而 将 此 值 设 置 为 1。 


3. StartIndexLocation: 指 癌 索引 缓冲 区 中 的 某 个 元 素 ， 将 其 
标记 为 僻 读 取 的 起 始 索 3 





O 


4. BaseVertexLocation: 在 本 次 绘制 调用 读 取 顶点 之 前 ， 要 为 


每 个 索引 都 加 上 此 整数 值 。 


5. StartInstanceLocation: 用 于 实现 一 种 被 称 为 实例 化 的 高 级 
技术 ， 暂 将 其 设置 为 0。 


为 了 理解 这 些 参数 ， 让 我 们 来 思考 这 样 一 个 情景 : 假设 有 3 个 欲 绘 
制 的 物体 ， 一 个 球体 、 一 个 立方 体 以 及 一 个 圆柱 体 。 首 先 ， 每 个 物体 都 
有 目 己 的 项 点 缓冲 区 以 及 索引 缓冲 区 。 而 每 个 局 部 索引 缓冲 区 中 的 过 
引 ， 又 都 引用 的 是 各 自 的 局 部 顶点 缓冲 区 。 现 在 ， 我 们 把 这 3 个 物体 的 
顶点 和 索引 分 别 连接 为 全 局 顶点 缓冲 区 和 全 局 索引 缓冲 区 ， 如 图 6.3 所 
示 。《 在 顶点 缓冲 区 和 索引 缓冲 区 合并 的 过 程 中 ， 调 用 API 时 可 能 会 产 
生 一 些 开 销 ， 但 这 基本 上 不 会 成 为 程序 的 瓶颈 。 出 于 性 能 的 原因 ， 当 应 
用 中 有 一 些 可 以 轻易 合并 的 零散 顶点 缓冲 区 和 索引 缓冲 区 时 ， 便 值得 照 
这 样 试 一 试 ) 符合 并 完成 后 ， 索 引 绥 冲 区 里 的 元 素 就 不 能 正确 地 引用 对 
应 的 顶点 数据 了 ， 这 是 因为 它们 存储 的 索引 值 是 相对 于 物体 各 自 的 局 部 
顶点 缓冲 区 而 言 ， 而 非 全 局 的 顶点 缓冲 区 。 所 以 ， 还 需要 对 索引 值 进 行 
重新 计算 ， 使 之 可 以 正确 地 引用 全 局 顶点 绥 冲 区 中 的 顶点 数据 。 假 设 原 
始 的 立方 体 索 引 是 根据 下 述 立方 体 顶 点 编号 来 计算 的 : 

















0, 1, ..., NumBoxVertices-1 


但 是 在 顶点 缓冲 区 与 索引 缓冲 区 一 一 合并 之 后 ， 该 立方 体 的 索引 编 
号 将 依次 变 为 ; 


球体 ={VB, IB} 立方 体 = {VB, IB} 圆柱 体 = {VB, IB} 


全 局 顶点 缓冲 区 


款 体 顶点 立方 体质 点 圆柱 体 项 点 





0 firstBoxVertexPos 


firstCylVertexPos 


全 局 索引 缓冲 区 


numSphereInadices 


















numBoxIndices numCylIndices 


firstBoxIndex 


firstCylIindex 














图 6.3 ”将 几 个 顶点 缓冲 区 合并 为 一 个 大 的 顶点 缓冲 区 ， 再 把 对 应 的 若干 索引 缓冲 区 合并 为 一 个 
大 的 索引 缓冲 区 


firstBoxVertexPos, 
firstBoxVertexPos+1, 





a 
firstBoxVertexPos+numBoxVertices-1 


因此 ， 为 了 更 新 索引 ， 我 们 需要 为 每 个 立方 体 的 原 索 引 加 
上 firstBoxVertexPos 绥 冲 区 合并 后 立方 体 第 一 个 顶点 的 索引 
值 )。 类 似 地 ， 我 们 也 需要 给 每 个 圆柱 体 的 原 索 引 加 
上 firstCylVertexPos〔 绥 冲 区 合并 后 圆柱 体 第 一 个 顶点 的 索引 
值 )。 注 意 ， 球 体 的 索引 是 不 需要 改变 的 (因为 球体 第 一 个 顶点 的 位 置 











始终 为 0， 在 合并 后 的 全 局 索引 缓冲 区 中 也 未 曾 改变 ) 。 我 们 将 每 个 物 
体 的 第 一 个 顶点 相对 于 全 局 顶点 缓冲 区 的 位 置 叫 作 它 的 基准 顶点 地 址 

(base vertex location ) 。 通 常 来 计 ， 一 个 物体 的 新 索引 是 通过 原始 索引 
加 上 它 的 基准 顶点 地 址 来 获取 的 。 事 实 上 ， 我 们 不 必 亲 上 自 计算 新 的 索引 
值 : 通过 向 DrawIndexedInstanced 函 数 的 第 4 个 参数 传递 基准 顶点 地 
址 ， 即 可 让 Direct3D 去 执行 相关 计算 工作 。 








接 下 来 ， 我 们 再 通过 下 列 3 次 绘制 调用 来 依次 绘制 球体 、 立 方 体 和 
圆柱 体 : 
mCmdList->DrawIndexedInstanced( 


numSphereIndices, 1, 0, 606, 0); 
mCmdList->DrawIndexedInstanced( 


numBoxIndices, 1, firstBoxIndex, firstBoxVertexPos, 0); 
mCmdList->DrawIndexedInstanced( 
numCylIndices, 1, firstCylIindex, firstCylVertexPpos, 0); 





在 第 7 半 的 “Shapes” 示 例 项 目 中 将 采用 这 项 绘制 技术 。 


6.4 ”顶点 着 色 器 示例 





以 下 代码 实现 的 是 一 个 简单 的 顶点 着 色 器 (vertex shader， 回 顾 5.6 


cbuffer cbPerObject : register(b6) 


{ 
float4x4 gWorldViewProj; 
}; 


void VS(float3 iPosL : POSITION, 
float4 iColor : COLOR, 
out float4 oPosH : SV_POSITION, 
out float4 oColor : COLOR) 





// 把 项 点 变换 到 齐 次 裁剪 空间 
oPosH = mul(float4(iposL, 1.6f), gWorldViewProj); 








// 直接 将 顶点 的 颜色 信息 传 至 像素 着 色 器 


oColor = iColor; 














在 Direct3D 中 ， 编 写 着 色 占 的 语言 为 启 级 着 色 语 言 (High Level 
Shading Language，HLSL) [其 语法 与 C++ 十 分 相似 ， 这 使 得 它 较 易 
于 学 习 。 附 录 B 提 供 了 一 份 简 明 的 HLSL 参 考 资 料 。 我 们 将 结合 实例 来 学 
习 HLSL 和 着 色 器 的 编写 。 也 就 是 说 ， 随 着 本 书 内 容 的 推进 ， 我 们 将 为 
了 实现 手头 的 样 例 而 逐步 介绍 与 HLSL 有 关 的 新 概念 。 一 般 情 况 下 ， 着 
色 器 通常 在 以 .hlsl 为 扩展 名 的 文本 文件 中 编写 。 








顶点 着 色 器 就 是 上 例 中 名 为 VS 的 函数 。 值 得 注意 的 是 ， 我 们 可 以 
给 顶点 着 色 器 起 任意 合法 的 函数 名 。 上 述 顶点 着 色 器 共有 4 个 参数 ， 前 
两 个 为 输入 参数 ， 后 两 个 为 输出 参数 “通过 关键 子 out 来 表示 ) 。HLSL 











没有 引用 〈reference) 和 指针 〈pointer) 的 概念 ， 所 以 需要 借助 结构 体 
或 多 个 输出 参数 才能 够 从 函数 中 返回 多 个 数值 。 而 且 ， 在 HLSL 中 ， 所 
有 的 函数 都 是 内 联 (inline) 函数 。 


前 两 个 输入 参数 分 别 对 应 于 绘制 立方 体 所 自 定义 顶点 结构 体 中 的 两 
个 数据 成 员 ， 也 构成 了 顶点 着 色 器 的 输入 签名 (input signature) 。 参 数 
语义 “: POSITION 和“:COLOR” 用 于 将 顶点 结构 体 中 的 元 素 映 射 到 顶点 着 
色 器 的 相应 输入 参数 ， 如 图 6.4 所 示 。 


输出 参数 也 附 有 各 自 的 语义 (“:SV_POSITION” 和 “:COLOR”) ， 并 
以 此 作为 纽带 ， 将 顶点 着 色 器 的 输出 参数 映射 到 下 个 处 理 阶段 (几何 着 
色 右 或 像素 着 色 器 〉 中 所 对 应 的 输入 参数 。 注 意 ，SV_POSITION 语 义 比 
较 特 殊 (SV 代表 系统 值 ， 即 system value) ， 它 所 修饰 的 顶点 着 色 器 输 
出 元 素 存 有 齐 次 裁剪 空间 中 的 顶点 位 置信 息 。 因 此 ， 我 们 必须 为 输出 位 
置信 息 的 参数 附 上 SV_POSITION 语 义 ， 使 GPU 可 以 在 进行 例如 裁剪 、 深 
度 测 试 和 光栅 化 等 处 理 之 时 ， 借 此 实现 其 他 属性 所 无 法 介入 的 有 关 运 
算 。 值 得 注意 的 是 ， 对 于 任何 不 具有 系统 值 的 输出 参数 而 言 ， 我 们 都 可 
以 根据 需求 以 合法 的 语义 名 修饰 它 色 。 





struct Vertex 


XMFLOAT3 Pos; 
XMFLOAT4 Color; 
}; 


D3D12_INPUT_ELEMENT_DESC vertexDesc[] = 


{"POSITION", 8, DXGI_FORMAT_R32G32B32_FLOAT, 8，9@, 
D3D12_INPUT_CLASSIFICATION_PER_VERTEX_DATA，,08}，, 
{"COLOR", @, DXGI_FORMAT_R32G32B32A32_FLOAT, 6，12，, 
D3D12_INPUT_CLASSIFICATION_PER_VERTEX_DATA, 8} 
}; 


void VS(float3 iposL : POSITION, 
float4 iColor : COLOR, 
out float4 oPosH : SV_POSITION, 
out float4 oColor : COLOR) 








{ 
// Transform to homogeneous clip space. 
oPosH = mul(float4(iPosL, 1.6f), gWorldViewProj); 
// Just pass vertex color into the pixel shader. 
oColor = iColor; 
} 
图 6.4 ”通过 D3D12_INPUT_ELEMENT_DESC 数 组 为 每 个 顶点 元 素 都 指定 了 与 之 关联 的 语义 。 顶 点 





着 色 器 中 的 每 个 参数 也 各 附 有 一 个 语义 ， 该 语义 用 于 使 项 点 元 素 与 顶点 着 色 器 参数 逐一 匹配 

















述 顶 点 着 色 器 函数 的 第 一 行 代码 是 通过 将 顶点 与 4 x 4 矩 
es 使 其 坐标 由 局 部 空间 变换 到 齐 次 裁剪 空间 : 


// 将 顶点 坐标 变换 到 齐 次 裁剪 空间 





oPosH = mul(float4(iposL, 1.6f), gWorldViewProj); 


借助 构造 语法 float4(iPosL，1.6f) 即 可 构建 一 个 等 价 于 
float4(ipPosL.x，iposL.y，iposL.z，1.6f) 的 4D 向 量 。 我 们 知 
道 ， 顶 点 的 位 置 是 一 个 点 而 非 同 量 ， 所 以 将 同 量 的 第 4 个 分 量 设置 为 1 ( 
w= 二 1) 。 并 以 float2 与 float3 类 型 分 别 表示 2D 和 3D 癌 量 。 和 矩阵 变量 
gWorldViewProj 存 于 常量 缓冲 区 (constant buffer) 内， 我 们 会 在 6.6 节 
中 对 它 进 行 相关 讨论 。 内 置 函 数 〈built-in function, 也 译作 内 建 函 数 、 内 
部 函数 等 ) mul 则 用 于 计算 回 量 与 矩阵 之 间 的 乘法 。 顺 便 提 一 下 ，mu1l 

函数 可 以 根据 不 同 规模 的 矩阵 乘法 而 重 载 。 例 如 ， 我 们 可 以 用 mu1 函 数 














进行 两 个 4 x 4 矩阵 的 乘法 、 两 个 3 x 3 算 阵 的 乘法 或 者 一 个 1 x 3 向 量 与 
3 x 3 矩阵 的 乘法 等 。 着 色 器 函数 的 最 后 一 行 代码 把 输入 的 颜色 直接 复制 
给 输出 参数 ， 继 而 将 该 闫 色 传递 到 泻 染 流水 线 的 下 个 阶段 : 


oColor = iColor; 


我 们 可 以 把 函数 的 返回 类 型 和 输入 签名 蔡 换 为 结构 体 〈( 从 而 取代 过 
长 的 参数 列表 ) ， 即 将 以 上 顶点 着 色 器 改写 为 男 一 种 等 价 实现 : 


cbuffer cbPerObject : register(b6) 


{ 
float4x4 gWorldViewProj; 
}; 


struct VertexIn 


{ 
float3 PosL : POSITION; 


float4 Color : COLOR; 
}; 


struct VertexOut 


float4 PosH : SV_POSITION; 
float4 Color : COLOR; 


}; 


VertexOut VS(VertexIn vin) 
{ 


VertexOut vout; 











// 将 顶点 变换 到 齐 次 裁剪 空间 
vout .PosH = mul(float4(vin.PosL, 1.6f), gWorldViewpPro]j); 





// 直接 将 顶点 颜色 传 至 像素 着 色 器 


Vvout .Color = vin.Color; 








return vout; 





注 意 Note 和 


如 果 没 有 使 用 几何 着 色 器 〈 我 们 会 在 第 12 章 中 介绍 这 种 着 色 器 ) ， 
那么 顶点 着 色 器 必须 用 SV_POSITION 语 义 来 输出 顶点 在 齐 次 裁剪 空间 中 
的 位 置 ， 因 为 〈 在 没有 使 用 几何 着 色 器 的 情况 下 ) 执行 完 顶点 着 色 器 之 
后 ， 硬 件 期 望 获取 顶点 位 于 齐 次 裁剪 空间 之 中 的 坐标 。 如 果 使 用 了 几何 
着 色 器 ， 则 可 以 把 输出 顶点 在 齐 次 裁剪 空间 中 位 置 的 工作 交 给 它 来 处 
到 ， 





注 意 Note 


在 顶点 着 色 器 《或 几何 着 色 器 ) 中 是 无 法 进行 透视 除法 的 ， 此 阶段 
只 能 实现 投影 矩阵 这 一 环节 的 运算 。 而 透视 除法 将 在 后 面 交 由 硬件 执 





1 


连接 输入 布局 描述 符 与 输入 签名 


根据 图 6.4 来 看 ， 输 送 到 演 染 流水 线 的 顶点 属性 与 输入 布局 描述 的 
定义 相关 联 。 如 果 我 们 传 入 的 顶点 数据 与 顶点 着 色 器 所 期 望 的 输入 不 相 
符 ， 便 会 导 臻 错误。 例如， 下列 顶点 着 色 器 的 输入 签名 与 顶点 数据 就 是 


不 匹配 的 : 


struct Vertex 
{ 
XMFLOAT3 Pos; 
XMFLOAT4 Color; 
}; 


D3D12_INPUT_ELEMENT_DESC desc[|] = 
{ 
{"POSITION"，6，DXGI_FORMAT_R32G32B32_FLOAT，6，6， 
D3D12_ INPUT_CLASSIFICATION PER VERTEX DATA, 0}, 
{"COLOR", 0, DXGI_FORMAT_R32G32B32A32_FLOAT, 868，12,， 
D3D12_ INPUT_CLASSIFICATION PER VERTEX DATA, ©6} 





struct VertexIn 
{ 
float3 PosL : POSITION; 
float4 Color : COLOR; 
float3 Normal : NORMAL; 
}; 


struct VertexOut 

{ 
float4 PosH : SV_POSITION; 
float4 Color : COLOR; 

}; 


VertexOut VS(VertexIn vin) { ... } 





就 像 我 们 将 在 6.9 节 中 看 到 的 一 样 ， 在 创建 ID3D12Pipelinestate 
对 象 的 时 候 ， 必 须 指定 输入 布局 描述 和 顶点 着 色 器 ， 而 Direct3D 则 会 验 
证 两 者 是 否 匹 配 。 





事实 上 ， 顶 反 数 据 与 输入 签名 不 需要 完全 区 配 ， 前 提 是 我 们 一 定 要 


癌 顶点 着 色 器 提供 其 输入 签名 所 定义 的 顶点 数据 。 这 就 是 说 ， 顶 点 数据 
中 也 可 以 附带 一 些 顶 点 着 色 器 根本 用 不 到 的 额外 数据 。 下 面 的 代码 就 描 
述 了 这 样 一 种 匹配 的 情况 : 


struct Vertex 


XMFLOAT3 Pos; 
XMFLOAT4 Color; 
XMFLOAT3 Normal; 


}; 


D3D12_INPUT_ELEMENT_DESC desc[] = 


{"POSITION", 60, DXGI_ FORMAT R32G32B32_FLOAT, 6,，0,， 
D3D12_ INPUT_CLASSIFICATION PER VERTEX DATA, 0}, 
{"COLOR", 0, DXGI_FORMAT_R32G32B32A32_FLOAT, 8，12,， 
D3D12_ INPUT_CLASSIFICATION PER VERTEX DATA, 0}, 

{ "NORMAL", 60, DXGI_ FORMAT R32G32B32_FLOAT, 68，28, 
D3D12_INPUT_CLASSIFICATION PER VERTEX DATA, © } 





struct VertexIn 


float3 PosL : POSITION; 
float4 Color : COLOR; 
}; 


struct VertexOut 


{ 
float4 PosH : SV_POSITION; 


float4 Color : COLOR; 
}; 


VertexOut VS(VertexIn vin) { ... 





现在 ， 让 我 们 再 来 思考 这 样 一 种 情况 : 当 顶 点 结构 体 和 输入 签名 有 


着 匹配 的 顶点 元 素 ， 唯 独 两 者 的 颜色 属性 类 型 却 不 相同 ， 此 时 会 发 生 什 
么 呢 ? 


struct Vertex 

{ 
XMFLOAT3 Pos; 
XMFLOAT4 Color; 


}; 
D3D12_ INPUT_ ELEMENT DESC desc[] = 


{"POSITION", 0, DXGI_FORMAT_ R32G32B32_FLOAT, 686, 0, 
D3D12_INPUT_CLASSIFICATION PER VERTEX DATA, 0}, 
{"COLOR", 0, DXGI_FORMAT_ R32G32B32A32_FLOAT, 86，12,， 
D3D12_INPUT_CLASSIFICATION PER VERTEX DATA, 06} 





struct VertexIn 


float3 PosL : POSITION; 
int4 Color : COLOR; 


}; 


struct VertexOut 

{ 
float4 PosH : SV_POSITION; 
float4 Color : COLOR; 


}; 





VertexOut VS(VertexIn vin) { ... } 


这 其 实 也 是 合法 的 ， 因 为 Direct3D 人 允许 用 户 对 输入 寄存 器 (input 
register， 全 称 为 项 点 着 色 器 输入 寄存 器 〉 中 数据 的 类 型 重新 加 以 解释 。 
然而 ，VC++ 调 试 输出 窗口 还 是 会 给 出 下 面 的 警告 : 





D3D12 WARNING: ID3D12 Device::CreateInputLayout: The provided inputsignatu 
re expects to read an element with SemanticName/Index: “COLOR ' /eand compon 
ent(s) of the type 'int32'. However, the matching entry inthe Input Layout 
declaration, element[1], specifies mismatched format:"'R32G32B32A32 FLOAT' 
. This is not an error, since behavior is welldefined: The element format 
determines what data conversion algorithmgets applied before it shows up i 


n a shader register. Independently,the shader input signature defines how 
the shader will interpret thedata that has been placed in its input regist 
ers, with no change in thebits stored. It is valid for the application to 
reinterpret data asa different type once it is in the vertex shader, so th 
is warning isissued just in case reinterpretation was not intended by the 
author. 





(D3D12 和 警告 :ID3D12Device: :CreateInputLayout: 根据 代码 
中 提供 的 输入 签名 推断 ， 其 中 的 SemanticName/Index: 'COLOR' /8 项 
希望 读 取 'int32 ' 类 型 的 数据 分 量 。 但 是 ， 此 类 型 却 与 输入 布局 声明 中 
的 对 应 匹配 项 element[1] 所 指定 的 格式 'R32G32B32A32_FLOAT ' 不 匹 
配 。 这 并 不 是 一 个 错误 ， 因 为 Direct3D 对 该 行为 有 着 明确 的 定义 : 输入 
布局 中 的 元 素 格式 确定 的 是 ， 在 数据 未 进入 着 色 器 寄存 嚣 之前， 应 运用 
何 种 数据 转换 算法 来 确定 各 元 素 的 具体 格式 。 而 着 色 器 输入 签名 则 定义 
的 是 ， 在 不 修改 输入 寄存 器 中 所 存 数 据 的 情况 下 ， 顶 点 着 色 器 将 如 何 来 
解释 这 些 数 据 的 类 型 。 所 以 ， 在 应 用 程序 里 将 顶点 着 色 器 中 的 数据 重新 
解释 为 与 之 不 同 的 类 型 ， 亦 是 合法 的 。 因 此 ， 该 警告 只 用 于 提醒 在 无 意 
间 对 数据 类 型 作出 不 同 解释 的 程序 员 辐 。 ) 




















6.5 ”像素 看 色 需 示例 


号 像 在 5.10.3 市 中 所 讨论 的 那样 ， 为 了 计算 出 三 角形 中 每 个 像 系 的 
属性 ， 我 们 会 在 光栅 化 处 理 期 间 对 顶点 着 色 占 (或 几何 着 色 器 输出 的 
顶点 属性 进行 插值 。 随 后 ， 再 将 这 些 插值 数据 传 至 像素 着 色 器 中 作为 它 
的 输入 《参见 5.11 节 ) 。 现 假设 我 们 的 程序 未 使 用 几何 着 色 器 ， 图 6.5 展 
示 的 即 为 当前 顶点 数据 所 流 经 的 路 径 。 








像素 着 色 器 与 顶点 着 色 器 有 些 相 似 : 前 者 是 针对 每 一 个 像素 片段 
(pixel fragment)〉 而 运行 的 函数 ， 后 者 是 针对 每 一 个 顶点 而 运行 的 函数 
( 即 在 每 次 执行 时 处 理 单个 像素 (顶点 ) ) 。 只 要 为 像素 着 色 器 指定 了 
输入 数据 ， 它 融会 为 像素 片段 计算 出 一 个 对 应 的 颜色 。 值 得 我 们 注意 的 
是 ， 这 些 输入 像素 着 色 器 的 像素 片段 有 可 能 最 终 不 会 传 入 或 留存 在 后 台 
缓冲 区 中 。 例 如 ， 像 素 片段 可 能 会 在 像素 着 色 器 中 被 裁剪 掉 (HLSL 中 
内 置 了 一 个 裁 航 函 数 clip， 可 以 使 指定 的 像素 户 段 在 后 续 的 处 理 流 程 中 
被 忽略 掉 ) 、 被 另 一 个 具有 较 小 深度 值 的 像素 请 段 所 遮挡 或 者 在 类 似 于 
模板 缓冲 区 测试 的 后 续 泻 染 流水 线 测 试 中 被 丢弃 。 因 此 ， 在 确定 后 台 绥 
冲 区 某 一 像素 的 过 程 中 ， 可 能 会 存在 多 个 候选 的 像素 片段 。 这 就 是 “ 像 
素 户 段 ? 和 “ 像 际 "意义 的 差别， 尽管 有 时 这 两 个 术语 可 以 互 用 ， 但 是 在 
一 些 语 境 下 它们 的 意义 也 将 变 得 更 加 分 明 H9。 





struct Vertex 


XMFLOAT3 Pos; 

XMFLOAT3 Normal; 

XMFLOAT2 Texb; 
}; 


D3D12_INPUT_ELEMENT_DESC vertexDesc[] = 
{"POSITION”", 8@, DXGI_FORMAT_R32G32B32_FLOAT, 6,98, 
D3D12_INPUT _CLASSIFICATION _PER_VERTEX_DATA, 8}, 
{"NORMAL", ©@, DXGI_FORMAT_R32G32B32_FLOAT, 8，12, 
D3D12 INPUT _CLASSIFICATION_PER_VERTEX_DATA, 8}, 
{"TEXCOORD”", 8@, DXGI_FORMAT_R32G32_FLOAT, 80, 24, 
D3D12_INPUT _CLASSIFICATION_PER_VERTEX_DATA, 8} 
















}; 

void VS(float3 ipPosL : POSITION， 
float3 iNormalL ; NORMAL, 
float2 iTex9 : TEXCOORD, 
out float4 oPosH : SV_POSITION, 
out float3 oposW ; POSITION, 
out float3 oNormalW : NORMAL, 
out float2 oTex6 : TEXCOORD6， 
out float oFog : TEXCOORD1) 

{ 

} 


void PS(float4 posH : SV_POSITION, 
float3 posW ; POSITION, 
float3 normalW : NORMAL, 
float2 tex9 : TEXCOORD6， 
float fog : TEXCOORD1) 


图 6.5 ”每 个 顶点 元 素 都 会 与 D3D12_INPUT_ELEMENT_DESC 数 组 中 指定 的 对 应 语义 相关 联 。 而 顶 

点 着 色 器 中 的 每 个 参数 也 各 附 有 一 个 语义 ， 用 于 使 顶点 元 素 与 顶点 着 色 器 参数 相 匹 配 。 同 样 

地 ， 顶 点 着 色 器 的 每 个 输出 参数 以 及 像素 着 色 器 的 每 个 输入 参数 也 各 附 有 一 个 语义 ， 负 责 把 顶 
点 着 色 器 的 输出 参数 映射 到 像素 着 色 器 的 输入 参数 

















由 于 硬件 优化 的 原因 ， 某 些 像素 片段 在 移送 至 像素 着 色 器 之 前 ， 可 
能 已 经 被 泻 染 流水 线 所 剔除 《〈 例 如 提前 深度 剔除 ，early-z rejection， 也 
有 译作 早期 深度 剔除 、 早 期 ?剔除 等 ) 。 这 就 是 为 什么 要 首先 执行 深度 
测试 的 原因 ， 如 果 已 经 确定 某 像素 厂 段 被 遮挡 ， 那 么 像素 着 色 器 将 不 再 


对 筷 进 行 处 理 。 然 而 ， 也 有 一 些 情况 能 够 蓉 止 提前 次 度 剔 除 优化 。 比 如 
说 ， 倘 行 在 像素 着 色 圳 中 有 对 像素 深度 值 进 行 修 改 的 操作 ， 那 么 像 系 着 
色 句 了 束 必 须 针 对 每 个 像素 各 执行 一 次 ， 因 为 在 像素 着 色 器 修改 像素 深度 
值 以 前 ， 我 们 并 不 知道 每 个 像素 的 最 终 深度 值 。 








下 面 是 一 段 简单 的 像 系 着 色 需 代码 ， 它 与 6.4 贡 中 给 定 的 顶点 着 色 
器 相 呼 应 。 考 虑 到 代码 的 完整 性 ， 此 处 把 顶点 着 色 器 部 分 也 一 并 再 次 给 
出 。 


cbuffer cbPerObject : register(b6) 


float4x4 gWorldViewProj; 
}; 


void VS(float3 iPos : POSITION, float4 iColor : COLOR， 
out float4 oPosH : SV_POSITION, 
out float4 oColor : COLOR) 


{ 
// 将 项 点 变换 到 齐 次 裁 辫 空间 


oPosH = mul(float4(ipos, 1.6f), gWorldViewpProj); 


// 直接 把 顶点 颜色 传递 到 像素 着 色 器 
oColor = iColor; 


} 











float4 PS(float4 posH : SV_POSITION, float4 color : COLOR) : SV_ Target 
{ 


return color; 


} 





在 这 个 示例 中 ， 像 系 着 色 器 只 简单 地 返回 了 插值 颜色 数据 。 可 以 友 
现 ， 像 素 着 色 器 的 输入 与 顶点 着 色 器 的 输出 可 以 准确 匹配 ， 这 也 是 必须 
满足 的 一 点 。 像 素 着 色 器 返回 一 个 4D 颜 色 值 ， 而 位 于 此 函数 参数 列表 


后 的 SV_TARGET 语 义 则 表示 该 返回 值 的 类 型 应 当 与 泻 染 目标 格式 
(render target format〉 相 匹配 (该 输出 值 会 被 存 于 泻 染 目标 之 中 )。 


我 们 可 以 利用 输入 /输出 结构 体重 写 上 述 顶 点 着 色 器 和 像素 着 色 器 
的 等 价 实现 。i oA. 我 们 要 将 语义 附加 给 输 
入 /得 出 结构 体 中 的 成 员 ， 并 通过 一 条 用 于 输出 结构 体 的 返回 语句 代 符 
之 前 的 多 个 输出 参数 。 














cbuffer cbPerobject : register(b6) 


float4x4 gWorldViewProj; 
}; 


struct VertexIn 


float3 Pos : POSITION; 
float4 Color : COLOR; 


}; 


struct VertexOut 


{ 
float4 PosH : SV_POSITION; 


float4 Color : COLOR; 
}; 


VertexOut VS(VertexIn vin) 


VertexOut vout; 





// 把 顶点 变换 到 齐 次 裁剪 空间 
vout .PosH = mul(float4(vin.Pos, 1.6f), gWorldViewProj); 


// 直接 将 顶点 颜色 传 至 像素 着 色 器 


Vvout .Color = vin.Color; 








return vout; 


} 


float4 PS(VertexOut pin) : SV_Target 
{ 


return pin.Color; 


6.6 ”和 音量 缓冲 区 


6.6.1 创建 第 量 绥 冲 区 


常量 缓冲 区 (constant buffer) 也 是 一 种 GPU 资源 
(ID3D12Resource) ， 其 数据 内 容 可 供 着 色 占 程序 所 引用 。 束 人像 我 们 
在 本 书 中 将 会 学 到 的 纹理 等 其 他 类 型 的 缓冲 区 资源 一 样 ， 它 们 都 可 以 被 
着 色 器 程序 所 引用 。6.4 节 中 的 顶点 着 色 器 示例 有 如 下 代码 : 








cbuffer cbperObject : register(be) 
| float4x4 gWorldViewproj; 

在 这 段 代码 中 ，cbuffer 对 象 ( 常 量 缓冲 区 )〉 的 名 称 大 
cbPerobject， 其 中 存储 的 是 一 个 4 x 4 矩阵 gWorldViewProj， 表 示 把 
一 个 点 从 局 部 空间 变换 到 齐 次 裁 盘 空 间 所 用 到 的 由 世界 、 视 图 和 投影 3 
种 变换 组 合 而 成 的 矩阵 。 在 HLSL 中 ， 可 将 一 个 4 x 4 起 阵 声明 为 内 置 的 
float4x4 类 型 。 相 应 地 ， 要 声明 3 x 4 矩阵 或 2 x 4 矩阵 ， 即 可 分 别 使 
用 float3x4 和 float2x4 这 两 种 类 型 。 





与 顶点 缓冲 区 和 索引 绥 冲 区 不 同 的 是 ， 常 量 缓冲 区 通常 由 CPU 每 帧 
更 新 一 次 。 举 个 例子 ， 如 果 摄 像 机 每 帧 都 在 不 集 地 移动 ， 那 么 第 量 缓冲 
区 也 需要 在 每 一 帧 都 随 之 以 新 的 视图 矩阵 而 更 新 。 所 以 ， 我 们 会 把 币 量 
缓冲 区 创建 到 一 个 上 传 扒 而 非 默 认 堆 中 ， 这 样 做 能 使 我 们 从 CPU 器 更 新 








常量 缓冲 区 对 硬件 也 有 特别 的 要 求 ， 即 常量 缓冲 区 的 大 小 必 为 硬件 
最 小 分 配 空 间 (256B) 的 整数 倍 。 


我 们 经 党 需要 用 到 多 个 相同 类 型 的 常量 绥 冲 区 。 例 如 ， 假 设 常量 绥 
冲 区 cbPer0bject 内 存储 的 是 随 不 同 物体 而 异 的 常量 数据 ， 因 此 ， 如 果 
我 们 要 绘制 n 个 物体 ， 则 需要 n 个 该 类 型 的 常量 缓冲 区 。 下 列 代码 展示 了 
我 们 是 如 何 创建 一 个 缓冲 区 资源 ， 并 利用 它 来 存储 NumElements 个 常量 
缓冲 区 。 





struct ObjectConstants 


DirectX: :XMFLOAT4X4 WorldViewProj = MathHelper::Identity4x4(); 
}; 


UINT mElementByteSize = d3dUtil::CalcConstantBufferByteSize(sizeof 
(ObjectConstants)); 


CompPtr<ID3D12Resource> mUploadCBuffer; 
device->CreateCommittedResource( 
&CD3DX12_HEAP PROPERTIES(D3D12 HEAP TYPE_UPLOAD), 
D3D12_HEAP_FLAG_ NONE, 
&CD3DX12 RESOURCE _ DESC: :Buffer(mElementByteSize * NumElements), 
D3D12 RESOURCE STATE_ GENERIC_ READ, 
nullptr, 
IID_PPV_ARGS(&mUploadCBuffer ) ) ; 





我 们 可 以 认为 muploadCBuffer 中 存储 了 一 个 ObjectConstants 类 
型 的 常量 缓冲 区 数组 (同时 按 256 字 市 的 整数 倍 来 为 之 填充 数据 ) 。 行 
到 绘制 物体 的 时 候 ， 只 要 将 常量 缓冲 区 视图 (Constant Buffer View， 
CBV) 绑 定 到 存 有 物体 相应 常量 数据 的 缓冲 区 子 区 域 即 可 。 由 于 
mUploadCBuffer 绥 冲 区 存储 的 是 一 个 常量 绥 冲 区 数组 ， 因 此 ， 我 们 把 





它 称 之 为 常量 缓冲 区 。 


工具 函数 d3dutil: :CalcConstantBufferByteSize 会 做 适当 的 
运算 ， 使 缓冲 区 的 大 小 凑 整 为 硬件 最 小 分 配 空间 〈256B) 的 整数 倍 。 


UINT d3duUtil: :CalcConstantBufferByteSize(UINT byteSize) 


{ 
// 常量 缓冲 区 的 大 小 必须 是 硬件 最 小 分 配 空间 (通常 是 256B) 的 整数 倍 
// 为 此 ， 要 将 其 凑 整 为 满足 需求 的 最 小 的 256 的 整数 倍 。 我 们 现在 通过 为 输入 值 byteSize 
加 上 255， 
// 再 屏蔽 求 和 结果 的 低 2 字 节 〈 即 计算 结果 中 小 于 256 的 数据 部 分 ) 来 实现 这 一 点 
// 例如 : 假设 pytesize = 366 




















// (368 + 255) & ~255 

// 555 & ~255 

// 0x822B & ~6X66f 

// 6x622B & 0xff66 

// 6Xx60266 

// 512 

return (byteSize + 255) & ~255; 





注意 Note 和 


尽管 我 们 已 经 按照 上 述 方式 在 程序 中 分 配 出 了 256 整 数 倍 字 节 大 小 
的 数据 空间 ， 但 是 却 无 须 为 HLSL 结 构 体 中 显 式 填 充 相 应 的 常量 数据 ， 
这 是 因为 它 会 暗中 自行 完成 这 项 工作 : 




















// 隐 式 填充 为 256B 
cbuffer cbPerObject : register(b6) 


float4x4 gWorldViewProj; 
}; 


// 显 式 填 充 为 256B 
cbuffer cbPerObject : register(b6) 


float4x4 gWorldViewProj; 
float4x4 Pad6; 
float4x4 Pad1; 
float4x4 Pad2; 
}; 





注意 Note NW 


为 了 免 去 系统 将 常量 缓冲 区 元 系 隐 式 凑 整 为 256 字 节 整 数 倍 的 这 项 
处 理 环 证 ， 我 们 可 以 手动 地 填充 所 有 的 常量 绥 冲 区 结构 体 ， 使 之 皆 为 
256 字 市 的 整数 倍 。 








随 Direct3D 12 一 同 推出 的 是 着 色 器 模型 〈shader model， 
SM) 105.1。 其 中 新 引进 了 一 条 可 用 于 定义 常量 缓冲 区 的 HLSL 语 法 ， 
它 的 使 用 方法 如 下 : 








struct ObjectConstants 


float4x4 gWorldViewProj; 


uint matIndex; 
}; 
ConstantBuffer<ObjectConstants> gObjConstants : register(b0); 








在 此 段 代 码 中 ， 管 量 缓冲 区 的 数据 元 系 被 定义 在 一 个 单独 的 结构 体 
中 ， 随 后 再 用 此 结构 体 来 创建 一 个 常量 绥 冲 区 。 这 样 一 来 ， 我 们 残 可 以 
利用 下 列 获 取 数 据 成 员 的 语法 ， 在 着 色 器 里 访问 常量 缓冲 区 中 的 各 个 字 





段 : 
6.6.2 更 新 常量 绥 冲 区 





由 于 常量 缓冲 区 是 用 D3D12_HEAP_TYPE_UPLOAD 这 种 堆 类 型 来 创建 
的 ， 所 以 我 们 就 能 通过 CPU 为 常量 绥 冲 区 资源 更 新 数据 。 为 此 ， 我 们 首 
先 要 获得 指 疝 欲 更 新 资源 数据 的 指针 ， 可 用 Map 方 法 来 做 到 这 一 点 : 
CompPtr<ID3D12Resource> mUploadBuffer; 


BYTE* mMappedData = nullptr; 
mUploadBuffer->Map(60, nullptr, reinterpret cast<void**>(&mMappedData)); 


第 一 个 参数 是 子 资源 (subresource)〉 的 索引 HJ， 指定 了 欲 映射 的 子 
资源 。 对 于 缓冲 区 来 说 ， 它 自身 就 是 唯一 的 子 资源 ， 所 以 我 们 将 此 参数 
设置 为 0。 第 二 个 参数 是 一 个 可 选项 ， 是 个 指向 D3D12_RANGE 结 构 体 的 
虽 针 ， 此 结构 体 描 述 了 内 存 的 映射 范围 ， 知 将 该 参数 指定 为 空 指针 ， 则 
对 整个 资源 进行 映射 。 第 三 个 参数 则 借助 双重 指针 ， 返 回 竺 映射 资源 数 
据 的 目标 内 存 块 。 我 们 利用 memcpy 函 数 将 数据 从 系统 内 存 (system 
memory， 也 就 是 CPU 端 控制 的 内 存 ) 复制 到 常量 缓冲 区 : 


memcpy (mMappedData, &data, dataSizeInBytes); 








当 第 量 绥 冲 区 更 新 完成 后 ， 我 们 应 在 释放 映 财 内 存 之 前 对 其 进 
行 Unmap〔 取 消 映射 操作 (3; 


if(mUploadBuffer != nullptr) 
mUploadBuffer->Unmap(6, nullptr); 





mMappedData = nullptr; 


Unmap 的 第 一 个 参数 是 子 资源 索引 ， 指 定 了 将 被 取消 映射 的 子 资 
源 。 知 取消 映射 的 是 缓冲 区 ， 则 将 其 置 为 0(。 第 二 个 参数 是 个 可 选项 ， 
是 一 个 指向 D3D12_RANGE 结 构 体 的 指针 ， 用 于 描述 取消 映射 的 内 存 范 
围 ， 若 将 它 指定 为 空 指针 ， 则 取消 整个 资源 的 映射 。 


6.6.3 ”上传 缓 冲 区 辅助 函数 


将 上 传 缓冲 区 的 相关 操作 简单 地 封装 一 下 ， 使 用 起 来 会 更 加 方便 。 
我 们 在 UploadBuffer.h 文 件 中 定义 了 下 面 这 个 类 ， 令 上 传 缓冲 区 的 相关 
处 理工 作 更 加 轻松 。 它 蔡 我 们 实现 了 上 传 缓冲 区 资源 的 构造 与 析 构 函 
数 、 处 理 资源 的 映射 和 取消 映射 操作 ， 还 提供 了 CopyData 方 法 来 更 新 
缓冲 区 内 的 特定 元 素 。 在 需要 通过 CPU 修改 上 传 缓冲 区 中 数据 的 时 候 

《例如 ， 当 观察 窍 阵 有 了 变化 ) ， 便 可 以 使 用 CopyData。 注 意 ， 此 类 
可 用 于 各 种 类 型 的 上 传 缓冲 区 ， 而 并 非 只 针对 和 常量 缓冲 区 。 当 用 此 类 管 
理 常 量 绥 冲 区 时 ， 我 们 就 需要 通过 构造 函数 参数 jsConstantBuffer 来 
对 此 加 以 插 述 。 男 外 ， 如 果 此 类 中 存储 的 是 常量 缓冲 区 ， 那 么 其 中 的 构 
造 函 数 将 自动 填充 内 存 ， 使 每 个 常量 缓冲 区 的 大 小 都 成 为 256B 的 整数 














template<typename T> 
class UploadBuffer 


public: 
UploadBuffer(ID3D12Device* device, UINT elementCount, 


bool isConstantBuffer) : 
mIsConstantBuffer(isConstantBuffer) 


mElementByteSize = sizeof(T); 





























// 常量 缓冲 区 的 大 小 为 256B 的 整数 倍 。 这 是 因为 硬件 只 能 按 m*256B 的 偏 移 量 和 n*256B 














的 数据 























// 长 度 这 两 种 规格 来 查看 常量 数据 
// typedef struct D3D12 CONSTANT BUFFER VIEW DESC { 
// UINT64 OffsetInBytes; // 256 的 整数 倍 























// UINT SizeInBytes; // 256 的 整数 倍 
// } D3D12 CONSTANT BUFFER VIEW DESC; 
if(isConstantBuffer) 


mElementByteSize = d3dUtil::CalcConstantBufferByteSize(sizeof 
(T)); 
ThrowIfFailed(device->CreateCommittedResource( 

&CD3DX12_HEAP_ PROPERTIES(D3D12 HEAP_TYPE_UPLOAD ) ， 

D3D12_HEAP_FLAG_ NONE, 

&CD3DX12 RESOURCE_ DESC::Buffer(mElementByteSize*elementCount), 

D3D12 RESOURCE STATE_ GENERIC READ, 
nullptr, 
IID_ PPV_ARGS(&mUploadBuffer))); 


ThrowIfFailed(mUploadBuffer->Map(6, nullptr, reinterpret cast<void**> 
(&mMappedData) ) ) ; 





// 只 要 还 会 修改 当前 的 资源 ， 我 们 就 无 须 取 消 映射 
// 但 是 ， 在 资源 被 GPU 使 用 期 间 ， 我 们 二 万 不 可 向 该 资源 进行 号 操作 《所 以 必须 借助 于 





















































同步 技术 ) 


UploadBuffer(const UploadBuffer& rhs) = delete; 
UploadBuffer& operator=(const UploadBuffer& rhs) = delete; 
~UploadBuffer() 


if(mUploadBuffer != nullptr) 
mUploadBuffer->Unmap(60, nullptr); 


mMappedData = nullptr; 


} 


ID3D12Resource* Resource()const 


{ 
return mUploadBuffer .Get(); 


} 


void CopyData(int elementIndex, const T& data) 


memcpy(&mMappedData[elementIndex*mElementByteSize], &data, sizeof(T)); 


private: 


Microsoft: :WRL: :Comptr<ID3D12Resource> mUploadBuffer; 


BYTE* mMappedData = nullptr; 


UINT mElementByteSize = 0) 
bool mIsConstantBuffer = false; 


}; 





一 般 来 讲 ， 物 体 的 世界 矩阵 将 随 其 移动 /旋转 /缩放 而 改变 ， 观 察 矩 
阵 随 虚拟 摄像 机 的 移动 /旋转 而 改变 ， 投 影 矩 阵 随 窗口 大 小 的 调整 而 改 
变 。 在 本 章 的 演示 程序 中 ， 用 户 可 以 通过 鼠标 来 旋转 和 移动 摄像 机 ， 变 
换 观 察 角度 。 因 此 ， 我 们 在 每 一 帧 都 要 用 Update 函 数 ， 以 新 的 观察 矩 
阵 来 更 新 “世界 一 观察 一 投影 ”3 种 矩阵 组 合 而 成 的 复合 矩阵 : 





void BoxApp: :OnMouseMove(WPARAM btnState, int x, int y) 


if((btnstate & MK_LBUTTON) != 6) 
{ 

















// 根据 鼠标 的 移动 距离 计算 旋转 角度 ， 令 每 个 像素 按 此 4 











] 度 的 1/4 进 行 旋转 





float dx = XMConvertToRadians(0.25f*static cast<float> 


(x - mLastMousePos.x)); 


float dy = XMConvertToRadians(0.25f*static cast<float> 


(y - mLastMousePos.y)); 





// 根据 女 标 的 输入 来 更 新 摄像 机 绕 立 方 体 旋 转 的 角度 
mTheta += dx; 
mPhi += dy; 








// 限制 角度 mPhi 的 范围 








mphi = MathHelper::Clamp(mPhi, 86.1f, MathHelper::Pi - 0.1f); 


} 
else if((btnState & MK RBUTTON) != 6) 


{ 
// 使 场景 中 的 每 个 像素 按照 标 移动 距离 的 9.8685 倍 进行 缩放 
float dx = 68.605f*static cast<float>(x - mLastMousePos.x); 
float dy = 68.605f*static cast<float>(y - mLastMousePos.y); 























// 根据 鼠标 的 输入 更 新 摄像 机 的 可 视 范 围 半径 


mRadius += dx - dy; 





// 限制 可 视 半 径 的 范围 
mRadius = MathHelper::Clamp(mRadius, 3.6f, 15.06f); 
} 


mLastMousePos.x = Xx; 
mLastMousePos.y = y; 


} 


void BoxApp: :Update(const GameTimer& gt) 

{ 
// 由 球 坐 标 《〈 也 有 译作 球面 坐标 ) 转换 为 笛 卡 儿 坐 标 
float x = mRadius*sinf(mPhi)*cosf(mTheta); 
float z = mRadius*sinf(mPhi)*sinf(mTheta); 
float y = mRadius*cosf(mpPhi); 


























// 构建 观察 矩阵 

XMVECTOR pos = XMVectorSet(x, y, z, 1.06f); 
XMVECTOR target = XMVectorZero() ; 

XMVECTOR up = XMVectorSet(6.6f, 1.06f, 60.6f, 0.6f); 


XMMATRIX view = XMMatrixLookAtLH(pos, target, up); 
XMStoreFloat4x4(&mView, view); 


XMMATRIX world = XMLoadFloat4x4(&mWorld); 
XMMATRIX proj = XMLoadF1loat4x4(&mProj ) ; 
XMMATRIX worldViewPro]j = world*view*proj; 





// 用 最 新 的 worldViewProj 矩阵 来 更 新 常量 缓冲 区 
ObjectConstants objConstants; 
XMStoreFloat4x4(&objConstants .WorldViewpProj, 
XMMatrixTranspose(worldViewProj)); 
moObJjectCB->CopyData(86，obJjConstants ) ; 

















在 4.1.6 节 中 ， 我 们 首次 通过 描述 符 对 象 将 资源 绑 定 到 泻 桨 流水 线 
上 。 到 目前 为 止 ， 本 书 已 经 依次 介绍 了 演 染 目标 、 深 度 / 模 板 缓冲 区 、 
顶点 缓冲 区 以 及 索引 绥 神 区 这 几 种 资源 描述 符 〈 或 称 视图 ) 的 使 用 方 
法 ， 现 在 还 震 利 用 描述 符 将 常量 缓冲 区 绑 定 全 演 染 流水 线 上 。 而 且 常 量 
缓冲 区 描述 符 都 要 存放 在 以 
D3D12_DESCRIPTOR_HEAP_TYPE_CBV_SRV_UAV 类 型 所 建 的 描述 符 堆 
里 。 这 种 扒 内 可 以 混合 存储 常量 缓冲 区 描述 符 、 着 色 器 资源 描述 符 和 无 
序 访 问 〈unordered access) 描述 符 。 为 了 存放 这 些 新 类 型 的 摘 述 符 ， 我 
们 需要 为 之 创建 以 下 类 型 的 新 式 描 述 符 堆 : 








= 
+ 


站 


ev 


D3D12_DESCRIPTOR_ HEAP_DESC cbvHeapDesc; 
cbvHeapDesc.NumDescriptors = 1; 

cbvHeapDesc.Type = D3D12 DESCRIPTOR HEAP_TYPE_CBV_SRV_UAV; 
cbvHeapDesc.Flags = D3D12 DESCRIPTOR HEAP_ FLAG SHADER VISIBLE; 
cbvHeapDesc.NodeMask = 6; 


CompPtr<ID3D12DescriptorHeap> mCbvHeap 
md3dDevice->CreateDescriptorHeap(&cbvHeapDesc， 
IID_PPV_ARGS(&mCbvHeap ) ) ; 





这 段 代码 与 我 们 之 前 创建 泻 染 目标 和 深度 /模板 绥 冲 区 这 两 种 资源 
摘 述 符 堆 的 过 程 很 相似 。 然 而 ， 其 中 却 有 着 一 个 重要 的 区 别 ， 那 就 是 在 
创建 供 着 色 器 程序 访问 资源 的 描述 符 时 ， 我 们 要 把 标志 Elags 指 定 
为 DESCRIPTOR_HEAP_FLAG_SHADER_VISIBLE。 在 本 章 的 示范 程序 
中 ， 我 们 并 没有 使 用 SRV (shader resource view， 着 色 器 资源 视图 ) 描 
述 符 或 UAV Cunordered access view， 无 序 访问 视图 ) 描述 符 ， 仅 是 绘 
制 了 一 个 物体 而 已 ， 因 此 只 需 创建 一 个 存 有 单个 CBV 描 述 符 的 堆 即 可 。 








通过 填写 D3D12_CONSTANT_BUFFER_VIEW_DESC 实 例 ， 再 调 


用 ID3D12Device:: CreateConstant- 
BufferView 方 法 ， 便 可 创建 常量 绥 冲 区 : 


// 绘制 物体 所 用 的 常量 数据 
struct ObjectConstants 


{ 
XMFLOAT4X4 WorldViewProj = MathHelper::Identity4x4(); 
}; 


// 此 常量 缓冲 区 存储 了 绘制 n 个 物体 所 需 的 常量 数据 

std: :unique ptr<UploadBuffer<ObjectConstants>> mObjectCB = nullptr; 

mObjectCB = std::make unique<UploadBuffer<ObjectConstants>>( 
md3dDevice.Get(), n, true); 
































UINT objCBByteSize = d3dUtil::CalcConstantBufferByteSize(sizeof(ObjectCons 
tants) ); 


// 绥 冲 区 的 起 始 地 址 ( 即 索 引 为 6 的 那个 常量 缓冲 区 的 地 址 )》 


D3D12 GPU_VIRTUAL ADDRESS cbAddress = mObjectCB->Resourcel()- 
>GetGPUVirtualAddress(); 








// 偏 移 到 常量 绥 冲 区 中 绘制 第 i 个 物体 所 需 的 常量 数据 
int boxCBufIndex = i; 
cbAddress += boxCBufIndex*objCBByteSize; 


D3D12 CONSTANT_ BUFFER VIEW DESC cbvDesc ; 

cbvDesc.BufferLocation = cbAddress; 

cbvDesc.SizeInBytes = d3dUtil::CalcConstantBufferByteSize(sizeof( 
ObjectConstants ) ) ; 


md3dDevice->CreateConstantBufferView( 
&cbvDesc， 
mCbvHeap->GetCPUDescriptorHandleForHeapStart()); 





结构 体 D3D12_CONSTANT_BUFFER_VIEW_DESC 描 述 的 是 绑 定 到 
HLSL 和 常量 缓冲 区 结构 体 的 常量 缓冲 区 资源 子 集 。 正 如 前 面 所 提 到 的 ， 
如 果 常 量 绥 冲 区 存储 了 一 个 内 有 nn 个 物体 常量 数据 的 常量 数组 ， 那 么 我 
们 就 可 以 通过 BufferLocation 和 SizeInBytes 参 数 来 获取 第 ;个 物体 的 
常量 数据 。 考 虑 到 硬件 的 需求 〈 即 硬件 的 最 小 分 配 空间 ) ， 成 





员 SizeInBytes 与 BufferLocation 必 须 为 256B 的 整数 倍 。 例 如 ， 若 将 
上 述 两 个 成 员 的 值 都 指定 为 64， 那 么 我 们 将 看 到 下 列 调试 错误 ; 


D3D12 ERROR: ID3D12Device::CreateConstantBufferView: SizeInBytes of 64 is 
invalid. Device requires SizeInBytes be a multiple of 256. 


D3D12 ERROR: ID3D12Device:: CreateConstantBufferView: BufferLocation of 64 
is invalid. Device requires BufferLocation be a multiple of 256. 





(D3D12 错 误 : ID3D12Device::CreateConstantBufferView: 
将 sizeInBytes 的 值 设 置 为 64 是 无 效 的 。 设 备 要 求 SizeInBytes 的 值 为 
256 的 整数 倍 。 


D3D12 错 误 :ID3D12Device:: CreateConstantBufferView: 
将 BufferLocation 的 值 设置 为 64 是 无 效 的 。 设 备 要 
求 BufferLocation 的 值 为 256 的 整数 倍 。) 


6.6.5” 根 签名 和 描述 符 表 


通常 来 讲 ， 在 绘制 调用 开始 执行 之 前 ， 我 们 应 将 不 同 的 着 色 器 程序 
所 需 的 各 种 类 型 的 资源 绑 定 到 泻 染 流水 线 上 。 实 际 上 ， 不 同类 型 的 资源 
会 被 绑 定 到 特定 的 寄存 器 槽 (register slot) 上 ， 以 供 着 色 器 程序 访问 。 
比如 说 ， 前 文 代码 中 的 顶点 着 色 器 和 像素 着 色 器 需要 的 是 一 个 绑 定 到 寄 
存 器 b0 的 常量 绥 冲 区 。 在 本 书 的 后 续 内 容 中 ， 我 们 会 用 到 这 两 种 着 色 器 
更 高 级 的 配置 方法 ， 以 使 多 个 常量 缓冲 区 、 纹 理 〈texture) 和 采样 喜 
Csampler) 都 能 与 各 自 的 寄存 器 槽 相 绑 定 : 





























// 将 纹理 资源 绑 定 到 纹理 寄存 器 模 9 





Texture2D gDiffuseMap : register(t6) 





// 把 下 列 采 样 器 资源 依次 绑 定 到 采样 器 寄存 器 槽 9~5 


SamplerState gsamPpointWrap : _ register(s6) ; 
SamplerState gsamPointClamp : register(s1) ; 
SamplerState gsamLinearWrap : register(s2); 
SamplerState gsamLinearClamp : register(s3); 
SamplerState gsamAnisotropicWrap : register(s4); 


SamplerState gsamAnisotropicClamp : register(s5); 











// 将 常量 缓冲 区 资源 (cbuffer) 绑 定 到 常量 缓冲 区 寄存 器 槽 8 
cbuffer cbPerObject : register(b6) 








float4x4 gWorld; 
float4x4 gTexTransform; 
}; 


// 绘制 过 程 中 所 用 的 杂项 常量 数据 
cbuffer cbPass : register(b1) 








float4x4 gView; 
float4x4 gProj; 
[...] // 为 篇 幅 而 省 略 的 其 他 字段 

















了 





// 绘制 每 种 材质 所 需 的 各 种 不 同 的 常量 数据 
cbuffer cbMaterial : register(b2) 
{ 

float4 gDiffuseAlbedo; 

float3 gFresnelRe; 

float gRoughness; 

float4x4 gMatTransform; 





根 签名 (root signature) 定义 的 是 : 在 执行 绘制 命令 之 前 ， 那 些 应 
用 程序 将 绑 定 到 演 染 流水 线 上 的 资源 ， 它 们 会 被 映射 到 着 色 器 的 对 应 输 
入 寄存 器 。 根 签名 一 定 要 与 使 用 它 的 着 色 器 相 兼容 《〈 即 在 绘制 开始 之 
前 ， 根 签名 一 定 要 为 着 色 器 提供 其 执行 期 间 需 要 绑 定 到 演 染 流水 线 的 所 
有 资源 ) ， 在 创建 流水 线 状态 对 象 〈pipeline state object) 时 会 对 此 进行 
验证 《参见 6.9 节 ) 。 不 同 的 绘制 调用 可 能 会 用 到 一 组 不 同 的 着 色 器 程 
序 ， 这 也 就 意味 着 要 用 到 不 同 的 根 签名 。 








注意 Note pe 


如 琳 我 们 把 着 色 需 程序 当 作 一 个 函数 ， 而 将 输入 资源 看 作者 色 器 的 
函数 参数 ， 那 么 根 签名 则 定义 了 函数 签名 《其 实 这 就 是 “ 根 签名 ”一 词 的 
由 来 》。 通 过 绑 定 不 同 的 资源 作为 参数 ， 看 色 器 的 输出 也 将 有 所 差别 。 
例如 ， 项 点 着 色 器 的 输出 取决 于 实际 癌 它 输入 的 顶点 数据 以 及 为 它 绑 定 
的 具体 资源 。 


在 Direct3D 中 ， 根 签名 由 ID3D12RootSignature 接 口 来 表示 ， 并 以 
一 组 描述 绘制 调用 过 程 中 着 色 器 所 需 资 源 的 根 参 数 (root parameter) 定 
义 而 成 。 根 参数 可 以 是 根 各 量 (root constant) 、 根 描述 符 〈root 
descriptor) 或 者 描述 符 表 (descriptor table) 。 我 们 在 本 章 中 仅 使 用 描 
述 符 表 ， 其 他 根 参数 均 在 第 7 章 中 进行 讨论 。 描 述 符 表 指 定 的 是 描述 符 
堆 中 存 有 摘 述 符 的 一 块 连续 区 域 。 








下 面 的 代码 创建 了 一 个 根 签 名 ， 它 的 根 参 数 为 一 个 描述 符 表 ， 其 大 
小 足以 容 下 一 个 CBV 〈 和 常量 缓冲 区 视图 ，constant buffer view) 。 





// 根 参 数 可 以 古 描 述 符 表 、 根 描述 符 或 根 币 量 
CD3DX12_ROOT_PARAMETER slotRootParameter[1]; 


// 创建 一 个 只 存 有 一 个 CBV 的 描述 符 表 
CD3DX12 _ DESCRIPTOR RANGE cbvTable; 
cbvTable.Init( 
D3D12 DESCRIPTOR RANGE_TYPE_CBYV, 
1，// 表 中 的 描述 符 数 量 

















6);// 将 这 段 描述 符 区 域 绑 定 至 此 基准 着 色 器 寄存 器 (base shader register) 





























ee InitAsDescriptorTab1le( 
// 描述 各 全 区域 的 数量 
人 // 指向 描述 符 区 域 数组 的 指针 


// 根 签名 由 一 组 根 参数 构成 
CD3DX12_ROOT_SIGNATURE_DESC rootSigDesc(1, slotRootPparameter, 0, nullptr, 
D3D12 ROOT_SIGNATURE_FLAG ALLOW INPUT_ ASSEMBLER_ INPUT_LAYOUT); 











ANS 






































// 创建 仅 合 一 个 槽 位 《〈 该 槽 位 指向 一 个 仅 由 单个 常量 缓冲 区 组 成 的 描述 符 区 域 ) 的 根 签名 

Comptr serializedRootSig = nullptr; 

Comptr errorBlob = nullptr; 

HRESULT hr = D3D12SerializeRootSignature(&rootSigDesc, 
D3D_ ROOT_SIGNATURE VERSION 1， 
serializedRootSig.GetAddressof()， 
errorBlob.GetAddressOf());[15] 

ThrowIfFailed(md3dDevice->CreateRootSignature( 

9， 
serializedRootSig->GetBufferPointer( )， 
serializedRootSig->GetBufferSize()， 
IID_PPV_ARGS(&mRootSignature))); 











我 们 将 在 第 7 章 对 CD3DX12_ROOT_PARAMETER 和 
CD3DX12_DESCRIPTOR_RANGE 这 两 种 辅助 结构 进行 更 加 细致 的 解读 ， 现 
在 只 需 理解 下 述 代码 即 可 : 


CD3DX12 ROOT_ PARAMETER slotRootParameter[1]; 


CD3DX12_DESCRIPTOR_RANGE cbvTable; 
cbvTable.Init( 
D3D12_DESCRIPTOR_RANGE_TYPE_CBV，// 描述 符 表 的 类 型 


1，// 表 中 描述 符 的 数量 
8);// 将 这 段 描述 符 区 域 绑 定 至 此 基 址 着 色 器 寄存 器 
slotRootParameter[8].InitAsDescriptorTable( 
1， // 描述 符 区 域 的 数量 
&cbvTable); // 指向 描述 符 区 域 数组 的 指针 


























这 段 代码 创建 了 一 个 根 参数 ， 目 的 是 将 含有 一 个 CBV 的 摘 述 符 表 绑 
定 到 常量 缓冲 区 寄存 器 0， 即 HLSL 代 码 中 的 register(b68)。 


注意 Note pe 


本 章 中 所 展示 的 根 签名 示例 十 分 简单 。 读 者 在 此 书 的 大 部 分 范例 中 
会 见 到 根 签名 的 映 影 ， 而 且 根 签名 的 复杂 上 度 也 将 按 程 序 的 需求 而 逐渐 所 





+ 


根 签 名 只 定义 了 应 用 程序 要 绑 定 到 泻 染 流 水 线 的 资源 ， 却 没有 真正 
地 执行 任何 资源 绑 定 操作 。 只 要 率先 通过 命令 列表 〈command list) 设 
置 好 根 签名 ， 我 们 就 能 
用 ID3D12GraphicsCommandList::SetGraphicsRootDescriptorTab 
方法 令 描述 符 表 与 泻 染 流水 线 相 绑 定 。 


void ID3D12GraphicsCommandList: :SetGraphicsRootDescriptorTable( 


UINT RootParameterIndex， 
D3D12_GPU_DESCRIPTOR_HANDLE BaseDescriptor); 





1. RootParameterIndex: 将 根 参 数 按 此 索引 《〈 即 欲 绑 定 到 的 寄 
存 器 槽 号 ) 进行 设置 。 


2. BaseDescriptor: 此 参数 指定 的 是 将 要 回 着 色 器 绑 定 的 描述 符 


表 中 第 一 个 描述 符 位 于 描述 符 扒 中 的 句柄 。 比 如 说 ， 如 果 根 签名 指明 当 
前 描述 符 表 中 共有 5 个 描述 符 ， 则 堆 中 的 BaseDescriptor 及 其 后 面 的 4 


个 描述 符 将 被 设置 到 此 描述 符 表 中 。 


下 列 代码 先 将 根 签名 和 CBV 堆 设置 到 命令 列表 上 ， 并 随后 再 通过 设 
置 搬 述 符 表 来 指定 我 们 希望 绑 定 到 演 染 流水 线 的 资源 : 


mCommandList->SetGraphicsRootSignature(mRootSignature.Get()); 

ID3D12DescriptorHeap* descriptorHeaps[] = { mCbvHeap.Get() }; 

mCommandList->SetDescriptorHeaps(_countof(descriptorHeaps), 
descriptorHeaps); 


// 偏 移 到 此 次 绘制 调用 所 需 的 CBV 处 

CD3DX12_GPU_DESCRIPTOR HANDLE cbv(mCbvHeap 
->GetGPUDescriptorHandleForHeapStart()); 

cbv.0offset(cbvIindex, mCbvSrvUavDescriptorSize); 


mCommandList->SetGraphicsRootDescriptorTable(8@, cbv); 





注意 Note a 


出 于 性 能 的 原因 ， 我 们 应 当 使 根 签名 的 规模 尽 可 能 地 小 。 除 此 之 
外 ， 还 要 试 着 尽量 减少 每 帧 泻 染 过 程 中 根 签 名 的 修改 次 数 。 


每 当 在 《图形 ) 绘制 调用 或 (计算 ) 调度 〈dispatch， 也 有 译作 分 
派 ) 调 用 此 “调度 调用 ” 指 调度 计算 着 色 器 进行 GPU 通 用 计算 ) 之 间 有 
根 签名 的 内 容 〈 即 摘 述 符 表 、 根 常量 以 及 根 摘 述 符 ) 发 生 改 变 时 ， 
D3D12 的 驱动 程序 便 会 将 与 应 用 程序 相 绑 定 的 根 签名 内 容 自 动 更 新 为 最 


新 的 数据 。 因 此 ， 在 每 次 绘制 /调度 调用 时 都 会 产生 一 整套 独立 的 根 签 
名 状态 66 。 


注 意 Note 到 各 > 


如 傈 更 改 了 根 签名 ， 则 会 失去 现存 的 所 有 绑 定 关系 。 也 就 是 说 ， 在 
修改 了 根 签 名 后 ， 我 们 需要 按 新 的 根 签名 定义 重新 将 所 有 的 对 应 资源 绑 
定 到 演 染 流水 线 上 。 


6.7 编译 着 色 器 


在 Direct3D 中 ， 着 色 需 程序 必须 先 被 编译 为 一 种 可 移植 的 字 节 码 。 
接 下 来 ， 图 形 驱 动 程序 将 获取 这 些 字 节 码 ， 并 将 其 重新 编译 为 针对 当前 
系统 GPU 所 优化 的 本 地 指令 [ATIL1]。 我 们 可 以 在 运行 期 间 用 下 列 函 数 对 
着 色 器 进行 编译 。 








HRESULT D3DCompileFromFile( 
LPCWSTR pFileName, 
const D3D SHADER MACRO *pDefines, 
ID3DInclude *pInclude, 
LPCSTR pEntrypoint, 


LPCSTR pTarget, 

UINT Flags1, 

UINT Flags2, 

ID3DBlob **ppCode, 
ID3DBlob **ppErrorMsgs); 





1. pFileName: 我 们 希望 编译 的 以 .hlsl 作 为 扩展 名 的 HLSL 源 代码 
全 
2. pDefines: 在 本 书 中 ， 我 们 并 不 使 用 这 个 高 级 选项 ， 因 此 总 是 


将 它 指定 为 空 指针 。 关 于 此 参数 的 详细 信息 可 参见 SDK 文 档 。 


3. pInclude: 在 本 书 中 ， 我 们 并 不 使 用 这 个 高 级 选项 ， 因 而 总 是 
将 它 指定 为 空 指针 。 关 于 此 参数 的 详细 信息 可 详 见 SDK 文 档 。 


4. pEntrypoint: 着 色 器 的 入 口 点 函数 名 。 一 个 .hlsl 文 件 可 能 存 
有 多 个 着 色 器 程序 〈 例 如 ， 一 个 顶点 着 色 器 和 一 个 像素 着 色 器 ) ， 所 以 
我 们 需要 为 竺 编译 的 着 色 器 指定 入 口 点 。 


5. pTarget: 指定 所 用 着 色 器 类 型 和 版 本 的 字符 串 。 在 本 书 中 ， 
我 们 采用 的 着 色 器 模型 版 本 是 5.0 和 5.1[171。 


a) vs_5_6 与 vs_5_1: 表示 版 本 分 别 为 5.0 和 5.1 的 顶点 着 色 器 


(vertex shader) 。 


b) hs_5_8 与 hs_5_1: 表示 版 本 分 别 为 5.0 和 5.1 的 外 过 着 色 器 《hull 
shader) 。 


c) ds_5_8 与 ds_5_1: 表示 版 本 分 别 为 5.0 和 5.1 的 域 着 色 器 


(domain shader) 。 


d) gs_5_8 与 gs_5_1: 表示 版 本 分 别 为 5.0 和 5.1 的 几何 着 色 器 


(geometry shader) 。 


e) ps_5_6 与 ps_5_1: 表示 版 本 分 别 为 5.0 和 5.1 的 像素 着 色 器 
(pixel shader) 。 


f) cs_5_8 与 cs_5_1: 表示 版 本 分 别 为 5.0 和 5.1 的 计算 着 色 器 


(compute shader) 。 


6. Flags1: 指示 对 痢 色 器 代码 应 当 如 何 编译 的 标志 。 在 SDK 文 档 
里 ， 这 些 标志 列 出 得 不 少 ， 但 是 此 书 中 我 们 仅 用 两 种 。 





a) D3DCOMPILE_DEBUG: 用 调试 模式 来 编译 着 色 器 。 


b) D3DCOMPILE_SKIP_OPTIMIZATION: 指示 编译 器 跳 过 优化 阶段 


(对 调试 很 有 用 处 〉。 

7. Flags2: 我 们 不 会 用 到 处 理 效果 文件 的 高 级 编译 选项 ， 关 于 它 
的 信息 请 参见 SDK 文 档 。 

8. ppCode: 返回 一 个 指向 ID3DBlob 数 据 结 构 的 指针 ， 它 存储 着 编 
译 好 的 着 色 器 对 象 字 节 码 。 

9. ppErrorMsgs: 返回 一 个 指向 ID3DBlob 数 据 结构 的 指针 。 如 果 
在 编译 过 程 中 发 生 了 错误 ， 它 便 会 储存 报错 的 字符 串 。 

ID3DBlob 类 型 描述 的 其 实 就 是 一 段 普 通 的 内 存 块 ， 这 是 该 接口 的 
两 个 方法 : 

a) LPVOID GetBufferPointer: 返回 指向 ID3DBlob 对 象 中 数据 


的 void* 类 型 的 指针 。 由 此 可 见 ， 在 使 用 此 数据 之 前 务必 先 要 将 它 转 换 
为 适当 的 类 型 (参考 下 面 的 示例 〉。 


b) SIZE_T GetBufferSize: 返回 缓冲 区 的 字 节 大 小 ( 即 该 对 象 
中 的 数据 大 小 ) 。 


为 了 能 够 输出 错误 信息 ， 我 们 在 d3dUtilh/.cpp 文 件 中 实现 了 下 列 畏 
助 函数 在 运行 时 编译 着 色 器 : 








Comptr<ID3DBlob> d3dUtil::CompileShader( 
const std::wstring& filename, 
const D3D SHADER MACRO* defines, 
const std::string& entrypoint, 
const std::string& target) 











// 若 处 于 调试 模式 , 则 使 用 调试 标志 
UINT compileFlags = ©; 
#if defined(DEBUG) || defined(_ DEBUG) 
compileFlags = D3DCOMPILE_ DEBUG | D3DCOMPILE SKIP OPTIMIZATION; 
#endif 


HRESULT hr = S_OK; 


Comptr<ID3DBlob> byteCode = nullptr; 
Comptr<ID3DBlob> errors; 
hr = D3DCompileFromFile(filename.c str(), defines, 
D3D_ COMPILE STANDARD FILE INCLUDE, 
entrypoint.c_ str(), target.c str(), compileFlags, 8, &byteCode, 
&errors); 


// 将 错误 信息 输出 到 调试 窗口 
if(errors != nullptr) 
OutputDebugStringA( (char*)errors->GetBufferpointer()); 


ThrowIfFailed(hr); 


return byteCode; 





以 下 是 一 个 调用 此 函数 的 示例 : 


Comptr<ID3DBlob> mvsByteCode = nullptr; 

Comptr<ID3DBlob> mpsByteCode = nullptr; 

mvsByteCode = d3dUtil::CompileShader(L"Shaders\\color.hlsl1", 
nullptr, "VS", "vs 5 6"); 

mpsByteCode = d3dUtil::CompileShader(L"Shaders\\color.hlsl", 
nullptr, "PS", "ps 5 6"); 





HLSL 的 错误 和 警告 消息 将 通过 ppErrorMsgs 参 数 返 回 。 比 方 说 ， 
如 果 不 小 心 把 mul 函 数 拼写 错误 ， 那 么 我 们 便 会 从 调试 窗口 得 到 类 似 于 
下 列 的 错误 输出 : 


Shaders\color.hls1l(29,14-55): error X3664: undeclared identifier ‘mu' 


(Shaders\color.hls1(29,14-55): 错误 X3664: 未 声明 的 标识 符 'mu') 





仅 对 着 色 器 进行 编译 并 不 会 使 它 与 泻 染 流水 线 相 绑 定 以 供 其 使 用 ， 
我 们 将 在 6.9 市 中 介绍 相关 的 具体 做 法 。 





6.7.1 离线 编译 








我 们 不 仅 可 以 在 运行 期 间 编 译 着 色 器 ， 还 能 够 以 单独 的 步骤 〈 例 
如 ， 将 其 作为 构建 整个 工程 过 程 中 的 一 个 独立 环节 ， 或 是 将 其 视 为 资源 
内 容 流水 线 (asset content pipeline) 流程 的 一 部 分 ) 离线 地 (offline) 
编译 着 色 嚣 。 这 样 做 有 原因 耕 干 : 





1. 对 于 复杂 的 着 色 吉 来 说 ， 其 编译 过 程 可 能 耗 时 较 长 。 因 此 ， 借 
助 离线 编译 即 可 缩短 应 用 程序 的 加 载 时 间 。 


2. 以 便 在 早 于 运行 时 的 构建 处 理 期 间 提前 发 现 编译 错误 。 


3. 对 于 Windows 8 应 用 商店 中 的 应 用 而 言 ， 必 须 采 用 离线 编译 这 种 
我 们 通常 用 .cso ( 即 compiled shader object， 已 编译 的 着 色 器 对 象 ) 作 
为 已 编译 着 色 器 的 扩展 名 。 


为 了 以 离线 的 方式 编译 着 色 右 ， 我 们 将 使 用 DirectX 自 市 的 FXC 命 令 
行 编译 工具 。 为 了 将 color.hlsl 文 件 中 分 别 以 VS 和 PS 作为 入 口 点 的 顶点 着 
色 器 和 像素 着 色 器 编译 为 调试 版 本 的 字 节 人 码 ， 我 们 可 以 输入 以 下 命令 : 








fxc "color.hlsl" /0d /Zi /T vs 5 6 /E "VS" /Fo "color vs.cso" /Fc "color v 
s.asm" 
fxc "color.hlsl" /0d /Zi /T ps 5 6 /E "PS" /Fo "color ps.cso" /Fc "color p 


s.asm" 





为 了 将 colorhlsl 文 件 中 分 别 以 VS 和 PS 作为 入 口 点 的 顶点 着 色 器 和 像 
素 着 色 器 编译 为 发 行 版 本 的 字 节 码 ， 则 可 以 输入 以 下 命令 : 


fxc "color.hlsl" /T vs 5 6 /E "VS" /Fo "color vs.cso" /Fc "color vs.asm" 
fxc "color.hlsl" /T ps 5 6 /E "PS" /Fo "color ps.cso" /Fc "color ps.asm" 


参数 























禁用 优化 〈 对 于 调试 十 分 有 用 ) 
J 


/TI 
天 着 色 器 类 型 和 着 色 器 模型 的 版 本 
<string> 














/EE 

着 色 嚣 入口 点 
<string> 
/Fo 
<string> 


/Fc 输出 一 个 着 色 器 的 汇编 文件 清单 《对 于 调试 、 检 验 指令 数量 、 碍 阅 生成 的 
<string> | 代码 细节 都 是 很 有 帮助 的 ) 


如 果 试 图 编译 一 个 有 语法 错误 的 着 色 器 ， 则 FXC 会 将 错误 /警告 消 
































奶 输 出 到 命令 窗口 。 辟 如， 若是 在 color.hlsl 效 果 文件 中 拼 错 了 一 个 变量 
的 名 学: 


// 应 当 为 gWorldViewProj， 而 非 worldViewProj 





vout.PosH = mul(float4(vin.Pos, 1.6f), worldViewProj); 


那么 ， 我 们 会 因为 这 一 个 失误 而 从 调试 输出 窗口 收 到 许多 错误 信息 
(天 键 在 于 改正 最 上 面 的 错误 ): 








color.hlsl1(29,42-54): error X3664: undeclared 


identifier 
WorldViewPro]j 


color.h1s1(29,14-55): error X3613: 'mul': no matching 


2 parameter 
intrinsic function 


color.hlsl1(29,14-55): error X3613: Possible intrinsic 


functions are: 
color.h1s1(29,14-55): error X3613: mul(float|half... 


(color.hlsl1(29,42-54): 错误 X3664: 未 声明 的 标识 符 


"WorldViewProj 





color.h1s1(29,14-55): 错误 X38613:'mul': 没有 比 对 到 该 内 
置 函数 所 需 的 两 个 参数 


color.hls1(29,14-55): 错误 X3813: 可 能 的 内 置 函数 是 : 


color.hlsl1(29,14-55): 错误 X3613: 
mul(float|half...blabla...) 





可 见 ， 在 编译 期 间 及 时 获取 错误 信息 要 比 在 运行 时 才 获 得 错误 消 奶 
要 便捷 得 多 。 


既然 已 经 按 离 线 的 方式 把 顶点 着 色 器 和 像素 着 色 器 编译 到 .cso 文 件 
里 ， 也 就 不 需要 在 运行 时 对 其 进行 编译 〈《 即 ， 无 须 再 调 
用 D3DCompileFromFile 方 法 ) 。 但 是 ， 我 们 仍 要 将 .cso 文 件 中 已 编译 
好 的 着 色 器 对 象 字 节 人 码 加 载 到 应 用 程序 中 ， 这 可 以 由 C++ 的 标准 文件 输 
入 机 制 来 加 以 实现 ， 如 : 








Comptr<ID3DBlob> d3dUtil::LoadBinary(const std::wstring& filename) 
{ 


std::ifstream fin(filename, std::ios::binary); 


fin.seekg(0, std::ios base::end); 
std: :ifstream: :pos type size = (int)fin.tellg(); 
fin.seekg(0, std::ios base::beg); 


Comptr<ID3DBlob> blob; 
ThrowIfFailed(D3DCreateBlob(size, blob.GetAddressOf())); 


fin.read((char*)blob->GetBufferpointer(), size); 
fin.close(); 


return blob; 


} 


Comptr<ID3DBlob> mvsByteCode = d3dUtil::LoadBinary(L"Shaders\\color vs.cso 
"); 
Comptr<ID3DBlob> mpsByteCode = d3dUtil::LoadBinary(L"Shaders\\color ps.cso 
"); 





6.7.2 ”生成 着 色 需 汇编 代码 


FXC 程 序 根据 可 选 参数 /Fc 来 生成 可 移植 的 着 色 圳 汇编 代码 。 通 过 
查阅 独 色 需 的 汇编 代码 ， 既 可 核对 着 色 吉 的 指令 数量 ， 也 能 了 解 生成 的 
代码 细 市 一 一 这 是 为 了 验证 编译 占有 所 生成 的 代码 与 我 们 预想 的 是 否 一 
致 。 例 如 ， 如 果 我 们 在 HLSL 代 人 码 中 写 了 一 个 条 件 语 句 ， 那 么 可 能 会 认 
为 汇编 代码 中 将 存在 一 条 与 之 对 应 的 分 文 指令 。 在 可 编程 GPU 发 展 的 初 
期 阶段 中 ， 在 着 色 器 里 使 用 分 文 指令 的 代价 是 比较 高 昂 的 。 因 此 ， 编 译 
侣 时 第 会 通过 对 两 个 分 六 展开 求 值 ， 再 对 求 值 结果 进行 插值 来 整理 条 件 
语句 ， 以 避免 采用 分 文 指令 并 计算 出 正确 的 结果 。 例 如 ， 下 列 两 组 代码 


是 等 价 的 : 


float a = 2*y; 


float b = sqrt(y); float x = a + s*(b-a); 
== 1 (true) or s == 6 (false) if( s 


//s ==1:x=a+b-a=b= sqrt(y) 


x = sqrt(y); 


else 
//s == 0: x=a+ 6*(b-a) = a = 2*y 





因此 ， 大 采用 这 种 展开 整理 方法 ， 我 们 将 得 到 没有 任何 分 文 语 句 而 
效果 却 叉 与 整理 前 相同 的 代码 。 但 是 ， 在 不 查阅 厦 色 器 汇编 代码 的 情况 
下 ， 我 们 无 法 知道 此 展开 过 程 是 否 发 生 ， 甚 至 不 能 验证 生成 的 分 文 指令 











是 否 正确 。 有 时 ， 碍 看 着 色 器 汇编 代码 的 目的 是 为 了 和 弄 清 它 到 底 做 了 什 
么 。 下 面 就 是 一 个 由 color.hlsl 文 件 中 顶点 着 色 器 生成 的 汇编 代码 示例 : 





// 生成 自 微软 (R) HLSL 着 色 器 编译 器 6.4.9844.6 






















































































// 

// 

// 缓冲 区 定义 

// 

// cbuffer cbPerObject 

// 1{ 

// 

// float4x4 gWorldViewProj; // 偏 移 量 : 8 大 小 : 64 

// 

// } 

// 

// 

// 资源 绑 定 

// 

// 名 称 类 型 格式 维度 槽 元 素 

a a 

// cbPerObject cbuffer NA NA 0 1 

// 

// 

// 

// 输入 签名 

// 

// 名 称 索引 掩 码 ”寄存 器 系统 值 格式 使 用 情况 
J 
// POSITION 0 xyz 0 NONE float Xxyz 

// COLOR 0 xyzw 1 NONE float Xxyzw 
// 

// 

// 输出 签名 

// 

// 名 称 索引 掩 码 ”寄存 器 系统 值 格式 使 用 情况 
J 
// SV_POSITION 6 xyzw 0 POS float Xxyzw 
// COLOR 0 xyzw 1 NONE float Xyzw 
// 

vs 5 6 


dcl] globalFlags refactoringAllowed | skipOoptimization 
dcl_constantbuffer cb6[4]，immediateIndexed 

dcl_input v68.Xyz 

dcl_input v1.xyzw 


dcl_output_siv 06.xyzw，position 
dcl_output o1.Xxyzw 
dcl temps 2 


// 

// 初始 化 变量 关系 

// veO.x <- vin.PosL.x; ve.y <- vin.PosL.y; v86.z《- vin.PosL.z; 

// Vv1.x <- vin.Color.x; v1l.y <- vin.Color.y; Vv1.z <- vin.Color.z; Vv1i.w <- 
vin.Color.w; 

// 0o01l.x <- <VS return value>.Color.x; 


// ol.y <- <VS return value>.Color.y; 
// 0o01.z <- 《VS return value>.Color.2z; 
// ol.w <- 《VS return value>.Color.w; 
// 00.x <- <VS return value>.PosH.x; 
// oo0.y <- <VS return value>.PosH.y; 
// 00.z <- <VS return value>.PosH.z; 
// oo0.w <- <VS return value>.PosH.w 
// 


# 第 29 行 "color .hlsl1" 

mov r@.xyz, VO.xyzx 

mov re.w, 1(1.660066060) 

dp4 ri1i.x, re@.xyzw, cbe[8].xyzw // ri.x <- vout.PosH.x 
dp4 rl.y, re.xyzw, cbe[1].xyzw // rl.y <- vout.PosH.y 
dp4 r1.z, re@.xyzw, cb8e[2].xyzw // rli.z <- vout.PosH.z 
dp4 ri.w, re@.xyzw, cbe[3].xyzw // ri.w <- vout.PosH.w 


# 第 32 行 

mov r@.xyzw, V1.xyzw // re.x <- vout.Color.x; re@.y <- vout.Color.y; 
// re.z <- vout.Color.z; rO@.w <- vout.Color.w 

mov 00.Xyzw, r1.xyzw 

mov O01.Xxyzw, r@.xyzw 

ret 




















// 大 约 使 用 了 1e 个 指令 模 





6.7.3 ”利用 Visual Studio 离 线 编译 着 色 器 





Visual Studio 2015 集 成 了 一 些 对 着 色 器 程序 进行 编译 工作 的 文 持 。 
我 们 可 以 同 工 程 内 添加 .hlsl 文 件 ， 而 Visual Studio (VS) 会 识别 它们 并 提 
供 编 译 的 选项 〈 见 图 6.6) 。 这 些 在 UI 中 配置 的 选项 就 是 FXC 程 序 的 参 
数 。 在 同 VS 工 程 中 添加 HLSL 文 件 后 ， 它 将 成 为 构建 流程 的 一 部 分 ， 而 


着 色 器 也 将 会 被 FXC 程 序 所 编译 。 


Configuration: Active(Debug) v Platform: Active(x64) Y | Configuration Manager... 


4 Configuration Properties Look for options or switches: 
General | 
4 HLSLCompiler 
eneral ra 
a 
Advanced 坚 允 | 
Output Files Additional Include Directories 
5 


Yes V0d)| 

Yes (Zi) 

main 

S(OutDin) %(Filename).cso 


Shader Model 5 /5_0) 





Yes (/nologo) 


Disable Optimizations 
Disable optimizations, /Od implies /Gfp though output may not be identical to /Od /Gfp. 




















图 6.6 ”为 项 目 添加 一 个 自 定 义 的 构建 工具 


但 是 ， 使 用 VS 集成 的 HLSL 工 具 却 有 一 个 缺点 ， 即 它 只 人 允许 每 个 文 
件 中 仅 有 一 个 着 色 器 程序 。 因 此， 这 条 限制 将 令 顶 点 着 色 器 和 像素 着 色 
器 不 能 共存 于 一 个 文件 里 。 此 外 ， 我 们 有 时 和 希望 以 不 同 的 预 处 理 指令 
《preprocessor directives) 编译 同一 个 着 色 器 程序 ， 从 而 获取 同一 着 色 
颖 的 不 同 编译 结果 。 同 样 地 ， 如 果 使 用 集成 的 VS 工具 就 不 可 能 做 到 这 
一 点 ， 因 为 每 输入 一 个 .hlsl 文 件 则 只 能 输出 一 个 .cso 文 件 。 


6.8 ”光栅 需 状 态 








当今 演 染 流水 线 中 的 大 多 阶段 都 是 可 编程 的 ， 但 是 有 些 特 定 环节 却 
只 能 接受 配置 。 例 如 ， 用 于 配置 泻 染 流水 线 中 光栅 化 阶段 的 光栅 堪 状 态 
(rasterizer state) 组 由 结构 体 D3D12_RASTERIZER_DESC 来 表示 : 


typedef struct D3D12 RASTERIZER DESC { 
默认 值 


D3D12 FILL MODE FillMode; 
D3D12 CULL MODE CullMode; 
BOOL FrontCounterClockwise; 
INT DepthBias; 

FLOAT DepthBiasClamp; 

FLOAT SlopeScaledDepthBias; 
BOOL DepthClipEnable; 

BOOL MultisampleEnable; 
BOOL AntialiasedLineEnable; 
UINT ForcedSampleCount; 





// 
// 
// 
// 
// 
// 
// 
// 
// 
// 


默认 值 
默认 值 
默认 值 


昌 
昌 
昌 
昌 
昌 
昌 


认 值 
认 值 
认 值 
认 值 
认 值 








认 值 


、 


D3D12_FILL MODE SOLID 
D3D12_ CULL MODE_ BACK 
false 

0 

6.6f 

6.6f 

true 

false 

false 

0 


// 默认 值 为 : D3D12_CONSERVATIVE_RASTERIZATION_MODE_OFF 
D3D12_ CONSERVATIVE_RASTERIZATION_MODE ConservativeRaster; 


} D3D12_RASTERIZER_DESC ; 











其 中 大 部 分 对 于 我 们 而 言 是 相对 高 级 或 不 币 使 用 的 成 员 ， 我 们 可 以 
从 SDK 文 档 中 查阅 到 它们 的 相关 描述 。 下 面 仅 对 其 中 关键 的 3 个 成 员 进 


行 讲解 。 


1. Fill1Mode: 将 此 参数 设置 为 D3D12_FILL_MODE_WIREFRAME 是 
采用 线 框 模式 进行 泻 染 ， 而 设置 为 D3D12_FILL _MODE_SOLID 则 是 使 用 
实体 模式 进行 演 染 。 默 认 设 置 为 实体 泻 染 模式 。 





2. CullMode: 指定 D3D12_CULL_MODE_NONE 是 禁用 剔除 操 
作 ，D3D12_CULL_MODE_BACK 是 剔除 背面 朝向 的 三 角形 ， 


而 D3D12_CULL_MODE_FRONT 是 吻 除 正面 朝 癌 的 三 角形 。 默 认 配 置 为 吻 
除 背 面 绷 回 的 三 角形 。 


3. FrontCounterClockwise: 如 果 指 定 为 false， 则 根据 摄像 机 
的 观察 视角 ， 将 顶点 顺序 为 顺 时 针 方 癌 的 三 角形 看 作 正 面 朝 同 ， 而 把 逆 
时 针 绕 序 的 三 角形 当 作 背面 划 癌 。 相 反 ， 如 果 指 定 为 true， 则 根据 摄像 
机 的 观察 视角 ， 将 顶点 顺序 为 逆 时 针 方向 的 三 角形 看 作 正面 朝向 ， 而 把 
顺 时 针 组 序 的 三 角形 当 作 背面 朝 癌 。 此 参数 默认 值 为 false。 











下 列 代 码 展 示 了 如 何 创建 一 个 开局 线 框 模式 ， 且 茶 用 背面 剔除 的 光 
栅 化 状态 : 


CD3DX12_RASTERIZER_DESC rsDesc(D3D12 DEFAULT); 


rsDesc.FillMode = D3D12 FILL MODE_ WIREFRAME; 
rsDesc.CullMode = D3D12 CULL MODE_ NONE; 





CD3DX12_RASTERIZER_DESC 是 在 扩展 自 D3D12_RASTERIZER_DESC 
结构 体 的 基础 上 ， 又 添加 了 一 些 辅助 构造 函数 的 工具 类 。 其 中 有 一 个 以 
接收 CD3DX12_DEFAULT 作 为 参数 来 创建 光栅 化 状态 对 象 的 构造 函数 ， 
其 实 CD3DX12_DEFAULT 只 是 一 个 哑 类 型 (dummy) ， 而 此 函数 的 作用 
是 将 光栅 化 状态 中 需要 被 初始 化 的 成 员 重 载 为 默认 
值 。CD3DX12_DEFAULTH 引 和 D3D12_DEFAULT 的 定义 如 下 : 


struct CD3DX12 DEFAULT {}; 
extern const DECLSPEC SELECTANY CD3DX12 DEFAULT D3D12 DEFAULT; 


另外 ，D3D12_DEFAULT (CD3DX12_DEFAULT) 还 被 广泛 地 运用 于 
Direct3D 的 其 他 几 种 工具 类 中 [9]。 


6.9 ”流水 线 状 态 对 象 


到 目前 为 止 ， 我 们 已 经 展示 过 编写 输入 布局 描述 、 创 建 项 点 着 色 需 
和 像素 着 色 器 ， 以 及 配置 光栅 器 状态 组 这 3 个 步 又， 还 未 曾 讲解 如 何 将 
这 些 对 象 绑 定 到 图 形 流水 线 上 ， 用 以 实际 绘制 图 形 。 大 多 数控 制图 形 流 
水 线 状态 的 对 象 被 统称 为 流水 线 状 态 对 象 (Pipeline State Object， 
PSO) ， 用 ID3D12PipelineState 接 口 来 表示 。 要 创建 PSO， 我 们 首先 
要 填写 一 份 描述 其 细节 的 D3D12_GRAPHICS_PIPELINE_STATE_DESC 结 
构 体 实例 。 





typedef struct D3D12 GRAPHICS PIPELINE STATE_ DESC 
{ 
ID3D12RootSignature *pRootSignature; 
D3D12_SHADER_ BYTECODE VS ; 
D3D12_SHADER_ BYTECODE PS; 
D3D12_SHADER_BYTECODE DS; 
D3D12_SHADER_ BYTECODE HS ; 
D3D12_SHADER_ BYTECODE GS ; 
D3D12_STREAM OUTPUT_DESC StreamOutput; 
D3D12_BLEND_DESC BlendState; 
UINT SampleMask; 
D3D12 RASTERIZER DESC RasterizerState; 
D3D12_DEPTH_STENCIL DESC DepthStencilState; 
D3D12_INPUT_LAYOUT_DESC InputLayout; 
D3D12_PRIMITIVE TOPOLOGY_ TYPE PrimitiveTopologyType; 
UINT NumRenderTargets; 
DXGI_ FORMAT RTVFormats[8]; 
DXGI_FORMAT DSVFormat; 
DXGI_ SAMPLE DESC SampleDesc; 
} D3D12 GRAPHICS_PIPELINE_STATE_DESC;[29] 





1. pRootSsignature: 指 同 一 个 与 此 PSO 相 绑 定 的 根 签名 的 指针 。 
该 根 签名 一 定 要 与 此 PSO 指 定 的 着 色 器 相 兼 容 。 


2. VS: 待 绑 定 的 顶点 着 色 器 。 此 成 员 由 结构 
体 D3D12_SHADER_BYTECODE 表 示 ， 这 个 结构 体 存 有 指 问 已 编译 好 的 字 
节 码 数据 的 指针 ， 以 及 该 字 节 码 数据 所 占 的 字 节 大 小 。 








typedef struct D3D12 SHADER BYTECODE { 
const void *pShaderBytecode; 


SIZE_T BytecodeLength; 
} D3D12_SHADER_BYTECODE; 





3. PS: 待 绑 定 的 像素 着 色 髓 。 


4. DS: 竺 绑 定 的 域 着 色 器 《我 们 将 在 后 续 章 节 中 讲解 此 类 型 的 着 








5. HS: 待 绑 定 的 外 壳 着 色 器 〈 我 们 将 在 后 续 章 节 中 讲解 此 类 型 的 
着 色 器 ) 。 


6. GS: 待 绑 定 的 几何 着 色 器 《我 们 将 在 后 续 章 节 中 讲解 此 类 型 的 
着 色 器 〉。 





7. StreamOutput: 用 于 实现 一 种 称 作 流 输 出 〈stream-out) 的 高 
级 技术 。 目 前 我 们 仅 将 此 字段 清 零 。 


8. Blendstate: 指定 混合 (blending) 操作 所 用 的 混合 状态 。 我 
们 将 在 后 续 章 节 中 讨论 此 状态 组 ， 目 前 仅 将 此 成 员 指定 为 默认 的 
CD3DX12 BLEND DESC(D3D12 DEFAULT). 








9. SampleMask: 多 重 采样 最 多 可 采集 32 个 样本 。 借 此 参数 的 32 位 





整数 值 ， 即 可 设置 每 个 采样 点 的 采集 情况 〈 采 集 或 禁止 采集 ) 。 例 如 ， 
若 禁 用 了 第 5 位 〈 将 第 5 位 设置 为 0) ， 则 将 不 会 对 第 5 个 样本 进行 采样 。 
当然 ， 要 禁止 采集 第 5 个 样本 的 前 提 是 ， 所 用 的 多 重 采 样 至 少 要 有 5 个 
样本 。 假 如 一 个 应 用 程序 仅 使 用 了 单 采 样 (single sampling) ， 那 么 只 
能 针对 该 参数 的 第 1 位 进行 配置 。 一 般 来 说 ， 使 用 的 都 是 默认 值 
0xffffffff， 即 表示 对 所 有 的 采样 点 都 进行 采样 。 




















10. RasterizerState: 指定 用 来 配置 光栅 器 的 光栅 化 状态 。 


11. Depthstencilstate: 指定 用 于 配置 深度 /模板 测试 的 深度 / 模 
板 状 态 。 我 们 将 在 后 续 草 节 中 对 此 状态 进行 讨论 ， 目 前 只 把 它 设 为 默认 
的 CD3DX12_DEPTH_STENCIL_DESC(D3D12_DEFAULT) 。 








12. InputLayout: 输入 布局 描述 ， 此 结构 体 中 有 两 个 成 员 : 一 个 
由 D3D12_INPUT_ELEMENT_DESC 元 素 构 成 的 数组 ， 以 及 一 个 表示 此 数组 
中 元 素数 量 的 无 符号 整数 。 





typedef struct D3D12_INPUT_LAYOUT_DESC 


const D3D12 INPUT _ ELEMENT DESC *pInputElementDescs; 
UINT NumElements; 
} D3D12_INPUT_LAYOUT_DESC; 





13. PrimitiveTopologyType: 指定 图 元 的 拓扑 类 型 。 





typedef enum D3D12 PRIMITIVE TOPOLOGY_TYPE { 

D3D12_PRIMITIVE TOPOLOGY_TYPE_UNDEFINED = 0, 
D3D12_PRIMITIVE TOPOLOGY TYPE POINT = 1 
D3D12_PRIMITIVE TOPOLOGY TYPE LINE =2 
D3D12_PRIMITIVE TOPOLOGY_TYPE_TRIANGLE = 
D3D12_PRIMITIVE TOPOLOGY TYPE_PATCH = 4 
} D3D12_PRIMITIVE TOPOLOGY_TYPE:; 











14. NumRenderTargets: 同时 所 用 的 演 染 目标 数量 
《 即 RTVFormats 数 组 中 演 染 目标 格式 的 数量 ) 。 





15. RTVFormats: 演 染 目标 的 格式 。 利 用 该 数组 实现 回 多 泻 染 目 
标 同 时 进行 写 操作 。 使 用 此 PSO 的 泻 染 目标 的 格式 设 定 应 当 与 此 参数 相 
匹配 。 





16. DSVFormat: 深度 /模板 缓冲 区 的 格式 。 使 用 此 PSO 的 深度 / 模 
板 缓冲 区 的 格式 设 定 应 当 与 此 参数 相 匹 配 。 





17. SampleDesc: 描述 多 重 采 样 对 每 个 像素 采样 的 数量 及 其 质量 
级 别 。 此 参数 应 与 泻 染 目标 的 对 应 设置 相 匹 配 。 





在 D3D12_GRAPHICS_PIPELINE STATE_DESC 实 例 填写 完毕 后 ， 我 
们 即 可 用 ID3D12Device: :CreateGraphicsPipelineSstate 方 法 来 创 
建 ID3D12PipelineState 对 象 。 





Comptr mRootSignature; 
std: :vector mInputLayout; 
Comptr mvsByteCode; 
Comptr mpsByteCode,; 


D3D12_ GRAPHICS PIPELINE STATE DESC psoDesc; 
ZeroMemory(&psoDesc, sizeof(D3D12 GRAPHICS PIPELINE STATE_DESC)); 
psoDesc.InputLayout = { mInputLayout.data(), (UINT)mInputLayout.size() }; 
psoDesc.pRootSignature = mRootSignature.Get(); 
psoDesc.VS = 
{ 
Peinterpret_cast(mvsByteCode->GetBufferPointer() )， 
mvsByteCode->GetBufferSize() 
}; 
psoDesc.PS = 
{ 


reinterpret cast(mpsByteCode->GetBufferpointer()), 
mpsByteCode->GetBufferSize() 
并 
psoDesc.RasterizerState = CD3DX12 RASTERIZER DESC(D3D12 DEFAULT); 
psoDesc.BlendState = CD3DX12 BLEND DESC(D3D12 DEFAULT); 
psoDesc.DepthStencilState = CD3DX12 DEPTH STENCIL DESC(D3D12 DEFAULT); 
psoDesc.SampleMask = UINT MAX; 
psoDesc.PrimitiveTopologyType = D3D12 PRIMITIVE TOPOLOGY_TYPE_TRIANGLE; 
psoDesc.NumRenderTargets = 1; 
psoDesc.RTVFormats[6] = mBackBufferFormat; 
psoDesc.SampleDesc.Count = m4xMsaaState ? 4 : 1; 
psoDesc.SampleDesc.Quality = m4xMsaaState ? (m4xMsaaQuality - 1) : @; 
psoDesc.DSVFormat = mDepthStencilFormat; 


Comptr mpSO; 
md3dDevice->CreateGraphicsPipelinestate(&psoDesc， IID_PPV_ARGS(&mPSO) ) ) ; [21 





ID3D12PipelineState 对 象 集合 了 大 量 的 流水 线 状态 信息 。 为 了 
保证 性 能 ， 我 们 将 所 有 这 些 对 象 都 集 总 在 一 起 ， 一 并 送 至 演 染 流水 线 。 
通过 这 样 的 一 个 集合 ，Direct3D 便 可 以 确定 所 有 的 状态 是 否 彼此 兼容 ， 
而 驱动 程序 则 能 够 据 此 而 提前 生成 硬件 本 地 指令 及 其 状态 。 在 Direct3D 
11 的 状态 模型 中 ， 这 些 演 染 状态 片段 都 是 要 分 开 配 置 的 。 然 而 这 些 状态 
实际 都 有 一 定 的 联系 ， 以 致 如 果 其 中 的 一 个 状态 发 生 改 变 ， 那 么 驱动 程 
序 可 能 就 要 为 了 另 一 个 相关 的 独立 状态 而 对 硬件 重新 进行 编程 。 由 于 一 
些 状态 在 配置 流水 线 时 需要 改变 ， 因 而 硬件 状态 也 就 可 能 被 频 楷 地 改 
写 。 为 了 避免 这 些 见 余 的 操作 ， 驱 动 程序 往 往 会 推迟 针对 硬件 状态 的 编 
程 动作 ， 直 到 明确 整 条 流水 线 的 状态 发 起 绘制 调用 后 ， 才 正式 生成 对 应 
的 本 地 指令 与 状态 。 但 是 ， 这 种 延迟 操作 需要 驱动 在 运行 时 进行 额外 的 
记录 工作 ， 即 追踪 状态 的 变化 ， 而 后 才能 在 运行 时 生成 改写 硬件 状态 的 
本 地 代码 。 在 Direct3D 12 的 新 模型 中 ， 驱 动 程序 可 以 在 初始 化 期 间 生成 
对 流水 线 状 态 编 程 的 全 部 代码 ， 这 便 是 我 们 将 大 多 数 的 流水 线 状态 指定 
为 一 个 集合 所 带 来 的 好 处 。 




















注意 Note i 


由 于 PSO 的 验证 和 创建 操作 过 于 耗 时 ， 所 以 应 在 初始 化 期 间 就 生成 
PSO。 除 非 有 特别 的 需求 ， 例 如 ， 在 运行 时 创建 PSO 伊 始 就 要 当即 对 它 
进行 第 一 次 引用 的 这 种 情况 。 随 后 ， 我 们 就 可 将 它 存 于 如 散 列 表 〈 哈 希 
表 ) 这 样 的 集合 里 ， 以 便 在 后 续 使 用 时 快速 获取 。 


并 非 所 有 的 泻 染 状 态 都 封装 于 PSO 内 ， 如 视 口 (viewport) 和 裁剪 
矩形 (scissor rectangle) 等 属性 就 独立 于 PSO。 由 于 将 这 些 状 态 的 设置 
与 其 他 的 流水 线 状态 分 隔 开 来 会 更 有 效 ， 所 以 把 它们 强行 集中 在 PSO 内 
也 并 不 会 为 之 增添 任何 优势 。 


Direct3D 实 质 上 就 是 一 种 状态 机 (state machine) ， 里 面 的 事物 会 保 
持 它们 各 自 的 状态 ， 直 到 我 们 将 其 改变 。 如 果 我 们 以 不 同 的 PSO 去 绘制 
不 同 物 体 ， 则 需要 像 下 面 那 样 来 组 织 代码 : 











// 重 置 命令 列表 并 指定 初始 PSO 
mCommandList->Reset(mDirectCmdListAlloc.Get(), mpSO1.Get()); 
/* .… 使 用 PSO 1 绘制 物体 */ 





// 改变 PSO 


mCommandList->SetPipelineSstate(mPSO2.Get() ); 
/* .… 使 用 PSsO 2 绘制 物体 … */ 








// 改变 PS0 
mCommandList->SetpipelineState(mPpPS03.Get()); 
/* .… 使 用 PSO 3 绘制 物体 */ 








换 句 话说 ， 如 果 把 一 个 PSO 与 命令 列表 相 绑 定 ， 那 么 ， 在 我 们 设置 


另 一 个 PSO 或 重 置 命令 列表 之 前 ， 会 一 直 沿 用 当前 的 PSO 绘 制 物体 。 


数 。 
记 ， 


注 意 Note a 


考虑 到 程序 的 性 能 问题 ， 我 们 应 当 尽 可 能 减少 改变 PSO 状 态 的 次 
为 此 ， 知 能 以 一 个 PSO 绘 制 出 所 有 的 物体 ， 绝 不 用 第 二 个 PSO。 切 
不 要 在 每 次 绘制 调用 时 都 修改 PSO ! 


6.10 ”几何 图 形 辅助 结构 体 


在 本 书 中 ， 我 们 通过 创建 一 个 同时 存 有 项 点 缓冲 区 和 索引 绥 冲 区 的 
结构 体 来 方便 地 定义 多 个 几何 体 。 男 外 ， 借 此 结构 体 即 可 将 项 点 和 索引 
数据 置 于 系统 内 存 之 中 ， 以 供 CPU 读 取 。 例 如 ， 执 行 拾取 (picking〉 和 
健 撞 检测 (collision detection〉 这 样 的 工作 就 需要 CPU 来 访问 几何 体 数 
据 。 再 者 ， 该 结构 体 还 缓存 了 顶点 绥 冲 区 和 索引 绥 冲 区 的 一 些 重 要 属性 
(例如 格式 和 每 个 顶点 项 所 占用 的 字 节 数 ) ， 并 提供 了 返回 缓冲 区 视图 
的 方法 。 当 需要 定义 多 个 几何 体 时 ， 我 们 就 使 用 下 面 的 
MeshGeometry 〈 定 义 于 d3dUtilh 头 文件 中 ) 结构 体 。 











// 利用 SubmeshGeometry 来 定义 MeshGeometry 中 存储 的 单个 几何 体 
// 此 结构 体 适 用 于 将 多 个 几何 体 数据 存 于 一 个 顶点 缓冲 区 和 一 个 索引 缓冲 区 的 情况 
// 它 提供 了 对 存 于 顶点 缓冲 区 和 索引 缓冲 区 中 的 单个 几何 体 进 行 绘制 所 需 的 数据 和 偏 移 量 ， 
我 们 可 以 据 此 来 
// 实现 图 6 .3 中 所 描绘 的 技术 
struct SubmeshGeometry 
{ 
UINT IndexCount = ©@; 
UINT StartIndexLocation = 8; 
INT BaseVertexLocation = 0; 

















// 通过 此 子 网 格 来 定义 当前 SubmeshGeometry 结 构 体 中 所 存 几何 体 的 包围 盒 (bounding 
box) 。 我 们 

// 将 在 本 书 的 后 续 章节 中 使 用 此 数据 

DirectX: :BoundingBox Bounds; 


}; 








struct MeshGeometry 





{ 
// 指定 此 几何 体 网 格 集合 的 名 称 ， 这 样 我 们 就 能 根据 此 名 找到 它 


std::string Name; 




















// 系统 内 存 中 的 副本 。 由 于 顶点 /索引 可 以 是 泛 型 格式 〈 有 具体 格式 依 用 户 而 定 ) ， 所 以 用 B 
1ob 类 型 来 表示 
// 竺 用户 在 使 用 时 再 将 其 转换 为 适当 的 类 型 


























Microsoft: :WRL: :Comptr<ID3DBlob> VertexBufferCPU = nullptr; 
Microsoft: :WRL: :Comptr<ID3DBlob> IndexBufferCPU = nullptr; 


Microsoft: :WRL: :Comptr<ID3D12Resource> VertexBufferGPU = nullptr; 
Microsoft: :WRL: :Comptr<ID3D12Resource> IndexBufferGPU = nullptr; 


Microsoft: :WRL: :Comptr<ID3D12Resource> VertexBufferUploader = nullptr; 
Microsoft: :WRL: :Comptr<ID3D12Resource> IndexBufferUploader = nullptr; 














// 与 缓冲 区 相关 的 数据 

UINT VertexByteStride = ©; 

UINT VertexBufferByteSize = 0; 

DXGI_FORMAT IndexFormat = DXGI FORMAT_ R16 _UINT; 
UINT IndexBufferByteSize = 0@; 


// 一 个 MeshGeometry 结 构 体能 够 存储 一 组 顶点 /索引 组 冲 区 中 的 多 个 几何 体 
// 若 利 用 下 列 容 器 来 定义 子 网 格 几何 体 ， 我 们 就 能 单独 地 绘制 出 其 中 的 子 网 格 〈 单 个 几何 























体 ) 


}; 


std: :unordered map<std::string, SubmeshGeometry> DrawArgs; 


D3D12 VERTEX BUFFER VIEW VertexBufferView()const 


{ 
D3D12_VERTEX_BUFFER_VIEW vbyv; 


vbv.BufferLocation = VertexBufferGPU->GetGPUVirtualAddress(); 
vbv.StrideInBytes = VertexByteStride; 
vbv.SizeInBytes = VertexBufferByteSize; 


return vbyv; 


} 


D3D12 INDEX BUFFER VIEW IndexBufferView()const 


{ 
D3D12_ INDEX BUFFER VIEW ibv; 


ibv.BufferLocation = IndexBufferGPU->GetGPUVirtualAddress(); 
ibv.Format = IndexFormat; 
ibv.SizeInBytes = IndexBufferByteSize; 


return ibyv; 


} 
// 待 数据 上 传 至 GPU 后 ， 我 们 就 能 释放 这 些 内存 了 


void DisposeUploaders() 


{ 
VertexBufferUploader = nullptr; 


IndexBufferUploader = nullptr; 
} 





6.11 立方 体 演 示 程 序 


根据 目前 所 学 到 的 知识 ， 我 们 足以 编写 出 一 个 简单 的 演示 程序 。 所 
以 ， 我 们 现在 就 来 泻 染 一 个 富有 迷 弥 色彩 的 立方 体 〈 如 图 6.7 所 示 ) ， 
以 此 作为 本 章 的 结尾 。 这 个 例子 其 实 就 是 将 本 章 之 前 讨论 的 所 有 内 容 融 
汇 在 一 起 ， 提 炼 为 一 个 单独 的 程序 。 读 者 在 研习 此 程序 时 ， 应 当 配 合 回 
顾 本 章 相 应 的 知识 点 ， 直 到 理解 每 行 代码 的 意义 为 止 。 注 意 ， 该 程序 使 
用 的 Shaders\color.hlsl 文 件 己 在 6.5 节 的 末尾 处 列 出 。[24 

















VO et cite ttt 


// BoxApp.cpp 的 作者 为 Frank Luna (C) 2615 版 权 所 有 














// 展示 如 何 用 Direct3D 12 绘 制 一 个 立方 体 


// 控制 : 

//” 按 下 鼠标 左 键 拖 动 以 旋转 

//” 按 下 鼠标 右键 拖 动 来 缩放 

yy fe dt tt tt 
#include "../../Common/d3dApp.h" 

#include "../../Common/MathHelper.h" 

#include "../../Common/UploadBuffer.h" 





using Microsoft: :WRL: :ComPtr; 
using namespace DirectX; 
using namespace DirectX::PackedVector; 


struct Vertex 


{ 
XMFLOAT3 Pos; 


XMFLOAT4 Color; 
}; 


struct ObjectConstants 


XMFLOAT4X4 WorldViewProj = MathHelper::Identity4x4(); 
}; 


class BoxApp : public D3DApp 


{ 


public: 


BoxApp (HINSTANCE hInstance); 

BoxApp(const BoxApp& rhs) = delete; 

BoxApp& operator=(const BoxApp& rhs) = delete; 
~BoxApp(); 


virtual bool Initialize()override; 


private: 


virtual void OnResize()override; 
virtual void Update(const GameTimer& gt)override; 
virtual void Draw(const GameTimer& gt)override; 


virtual void OnMouseDown(WPARAM btnSstate, int x, int y)override; 
virtual void OnMouseUp(WPARAM btnState, int x, int y)override; 
virtual void OnMouseMove(WPARAM btnState, int x, int y)override; 


void BuildDescriptorHeaps(); 

void BuildConstantBuffers(); 

void BuildRootSignature(); 

void BuildShadersAndInputLayout(); 
void BuildBoxGeometry(); 

void BuildPSO(); 


private: 


ComPtr mRootSignature = nullptr; 
ComPptr mCbvHeap = nullptr; 


std: :unique ptr> moObjectCB = nullptr; 
std: :unique ptr mBoxGeo = nullptr; 


CompPtr mvsByteCode 
CompPtr mpsByteCode 


nullptr; 
nullptr; 


std: :Vector mInputLayout; 

ComPptr mpPSO = nullptr; 

XMFLOAT4X4 mWorld = MathHelper::Identity4x4(); 
XMFLOAT4X4 mView = MathHelper::Identity4x4(); 
XMFLOAT4X4 mpProj = MathHelper::Identity4x4(); 


float mTheta = 1.5f*XM PI; 
float mphi = XM PIDIV4; 


float mRadius = 5.6f; 


POINT mLastMousePos; 
}; 


int WINAPI WinMain(HINSTANCE hInstance, HINSTANCE prevInstance， 
PSTR cmdLine, int showCmd) 


// 针对 调试 版 本 开启 运行 时 内 存 检 测 
#if defined(DEBUG) | defined(_DEBUG) 

_CrtSetDbgFlag( _CRTDBG ALLOC MEM DF | _CRTDBG LEAK CHECK_DF ); 
#endif 





try 


{ 
BoxApp theApp(hInstance ) ; 


if(!theApp.Initialize()) 
return 0; 


return theApp.Run(); 


} 
catch(DxException& e) 


{ 
MessageBox(nullptr, e.ToString().c_str(), L"HR Failed", MB_OK); 


return 0; 


} 
} 


BoxApp: :BoxApp (HINSTANCE hInstance) 
: D3DApp (hInstance) 


{ 
} 
BoxApp: :~BoxApp() 


{ 
} 


bool BoxApp: :Initialize() 


{ 
if(!D3DApp: :Initialize()) 
return false; 


// 重 置 命 令 列 表 为 执行 初始 化 命令 做 好 准备 工作 
ThrowIfFailed(mCommandList->Reset(mDirectCmdListAlloc.Get(), nullptr)); 





BuildDescriptorHeaps(); 
BuildConstantBuffers(); 


BuildRootSignature(); 
BuildShadersAndInputLayout(); 
BuildBoxGeometry(); 
BuildPSO(); 


// 执行 初始 化 命令 

ThrowIfFailed(mCommandList->Close()); 

ID3D12CommandList* cmdsLists[] = { mCommandList.Get() }; 
mCommandQueue->ExecuteCommandLists( countof(cmdsLists), cmdsLists); 


// 等 待 初始 化 完成 


FlushCommandQueue( ) ; 


return true; 


} 


void BoxApp: :OnResize() 


{ 
D3DApp: :OnResize(); 





// 知 用 户 调整 了 窗口 尺寸 ， 则 更 新 纵横 比 并 重新 计算 投影 矩阵 

XMMATRIX P = XMMatrixPerspectiveFovLH(6.25f*MathHelper: :Pi, 
AspectRatio(), 1.6f, 16608.6f); 

XMStoreFloat4x4(&mProj, P); 


} 














void BoxApp: :Update(const GameTimer& gt) 

{ 
// 将 球 坐 标 转换 为 笛 卡 儿 坐 标 [23] 
float x = mRadius*sinf(mPhi)*cosf(mTheta); 
float z = mRadius*sinf(mPhi)*sinf(mTheta); 
float y = mRadius*cosf(mpPhi); 


// 构建 观察 矩阵 

XMVECTOR pos = XMVectorSet(x, y, z, 1.06f); 
XMVECTOR target = XMVectorZero(); 

XMVECTOR up = XMVectorSset(6.6f, 1.6f, 60.6f, 60.6f); 


XMMATRIX view = XMMatrixLookAtLH(pos, target, up); 
XMStoreFloat4x4(&mView, view); 


XMMATRIX world = XMLoadFloat4x4(&mWorld); 
XMMATRIX proj = XMLoadF1loat4x4(&mProj ) ; 
XMMATRIX worldViewProj = world*view*proj; 





// 用 当前 最 新 的 worldViewProj 和 矩阵 来 更 新 常量 缓冲 区 
ObjectConstants objConstants; 














XMStoreFloat4x4(&objConstants .WorldViewpProj, XMMatrixTranspose( 
worldViewProj)); 
mObjectCB->CopyData(0, objConstants); 


} 


void BoxApp: :Draw(const GameTimer& gt) 

{ 
// 复 用 记录 命令 所 用 的 内 存 
// 只 有 当 GPU 中 的 命令 列表 执行 完毕 后 ， 我 们 才 可 对 其 进行 重 置 
ThrowIfFailed(mDirectCmdListAlloc->Reset()); 





























// 通过 函数 ExecuteCommandList 将 命令 列表 加 入 命令 队列 后 ， 便 可 对 它 进 行 重 置 

// 复 用 命令 列表 即 复 用 其 相应 的 内 存 

ThrowIfFailed(mCommandList->Reset(mDirectCmdListAlloc.Get(), mpSO.Get()) 
); 





























mCommandList->RSSetViewports(1, &mScreenViewport); 
mCommandList->RSSetScissorRects(1, &mScissorRect); 

















// 按照 资源 的 用 途 指示 其 状态 的 转变 ， 此 处 将 资源 从 呈现 状态 转换 为 演 染 目标 状态 
mCommandList->ResourceBarrier(1, 

&CD3DX12 RESOURCE BARRIER: :Transition(CurrentBackBuffer( )， 

D3D12 RESOURCE STATE PRESENT, D3D12 RESOURCE STATE RENDER TARGET)); 














// 清除 后 台 绥 冲 区 和 深度 缓冲 区 
mCommandList->ClearRenderTargetView(CurrentBackBufferView()， 
Colors::LightSteelBlue, 68, nullptr); 
mCommandList->ClearDepthStencilView(DepthStencilView(), 
D3D12_CLEAR FLAG DEPTH | D3D12 CLEAR FLAG STENCIL, 
1.6f, 60, 60, nullptr); 








// 指定 将 要 演 染 的 目标 缓冲 区 
mCommandList->OMSetRenderTargets(1，&CurrentBackBufferView()， 
true, &DepthStencilView()); 





ID3D12DescriptorHeap* descriptorHeaps[] = { mCbvHeap.Get() }; 
mCommandList->SetDescriptorHeaps(_countof(descriptorHeaps), descriptorHe 


aps); 
mCommandList->SetGraphicsRootSignature(mRootSignature.Get()); 


mCommandList->IASetVertexBuffers(60, 1, &mBoxGeo->VertexBufferView()); 
mCommandList->IASetIndexBuffer(&mBoxGeo->IndexBufferView()); 
mCommandList->IASetPrimitiveTopology (D3D11 PRIMITIVE TOPOLOGY_ TRIANGLELI 


ST); [24] 


mCommandList->SetGraphicsRootDescriptorTable( 


} 


0, mCbvHeap->GetGPUDescriptorHandleForHeapStart()); 


mCommandList->DrawIndexedInstanced( 
mBoxGeo->DrawArgs["box"].IndexCount, 
1, 8, 0, 0); 























// 按照 资源 的 用 途 指示 其 状态 的 转变 ， 此 处 将 资源 从 泻 染 目标 状态 转换 为 呈现 状态 
mCommandList->ResourceBarrier(1, 

&CD3DX12 RESOURCE BARRIER: :Transition(CurrentBackBuffer( )， 

D3D12 RESOURCE STATE RENDER TARGET, D3D12 RESOURCE STATE PRESENT)); 





// 完成 命令 的 记录 
ThrowIfFailed(mCommandList->Close()); 


// 辣 命 令 队 列 添加 欲 执 行 的 命令 列表 
ID3D12CommandList* cmdsLists[] = { mCommandList.Get() }; 
mCommandQueue->ExecuteCommandLists(_ countof(cmdsLists), cmdsLists); 











// 交换 后 台 组 冲 区 与 前 台 绥 冲 区 
ThrowIfFailed(mSwapChain->Present(6, 8)); 
mCurrBackBuffer = (mCurrBackBuffer + 1) % SwapChainBufferCount; 


























// 等 待 绘制 此 帧 的 一 系列 命令 执行 完毕 。 这 种 等 待 的 方法 虽然 简单 却 也 低 效 
// 在 后 面 将 展示 如 何 重 新 组 织 泻 染 代码 ， 使 我 们 不 必 在 绘制 每 一 帧 时 都 等 待 


FlushCommandQueue( ) ; 



































void BoxApp: :OnMouseDown (WPARAM btnState, int x, int y) 


{ 


} 


mLastMousePos.x = XxX; 
mLastMousePos.y = y; 


SetCapture(mhMainWnd); 


void BoxApp: :OnMouseUp(WPARAM btnState, int x, int y) 


{ 


} 


ReleaseCapture(); 


void BoxApp: :OnMouseMove(WPARAM btnState, int x, int y) 


{ 


if((btnstate & MK_LBUTTON) != 6) 














{ 
// 根据 鼠标 的 移动 距离 计算 旋转 角度 ， 并 令 每 个 像素 都 按 此 角度 的 1/4 旋 转 
float dx = XMConvertToRadians(0.25f*static cast 
(x - mLastMousePos.x)); 








} 


float dy = XMConvertToRadians(0.25f*static cast 
(y - mLastMousePos.y)); 





// 根据 女 标 的 输入 来 更 新 摄像 机 绕 立 方 体 旋 转 的 角度 
mTheta += dx; 
mPhi += dy; 




















// 限制 角度 mPhi 的 范围 
mphi = MathHelper::Clamp(mPhi, 86.1f, MathHelper::Pi - 0.1f); 
} 
else if((btnState & MK _ RBUTTON) != 6) 
{ 
// 使 场景 中 的 每 个 像素 按 鼠 标 移 动 距离 的 9.685 倍 进行 缩放 
float dx = 68.605f*static cast(x - mLastMousePos .X) 
float dy = 6.665f#kstatic_ cast(y - mLastMousePos.y); 


























// 根据 鼠标 的 输入 更 新 摄像 机 的 可 视 范围 半径 


mRadius += dx - dy; 








// 限制 可 视 半 径 的 范围 
mRadius = MathHelper::Clamp(mRadius, 3.6f, 15.06f); 


} 
mLastMousePos.x = Xx; 
mLastMousePos.y = y; 


void BoxApp: :BuildDescriptorHeaps() 


{ 


} 


D3D12_ DESCRIPTOR_HEAP_DESC cbvHeapDesc; 

cbvHeapDesc.NumDescriptors = 1; 

cbvHeapDesc.Type = D3D12 DESCRIPTOR HEAP_ TYPE_CBV_SRV_UAV:; 

cbvHeapDesc.Flags = D3D12 DESCRIPTOR_ HEAP_FLAG SHADER VISIBLE; 
cbvHeapDesc.NodeMask = 6; 

ThrowIfFailed(md3dDevice->CreateDescriptorHeap(&cbvHeapDesc， 
IID_PPV_ARGS(&mCbvHeap ) ) ) ; 


void BoxApp::BuildConstantBuffers() 


{ 


mObjectCB = std::make unique>(md3dDevice.Get(), 
1, true); 


UINT objCBByteSize = d3dUtil::CalcConstantBufferByteSize(sizeof(Object- 
Constants ) ) ; 


D3D12_GPU_VIRTUAL_ADDRESS cbAddress = mObjectCB->Resource()-> 


} 


GetGPUVirtualAddress(); 
// 偏 移 到 常量 缓冲 区 中 第 i 个 物体 所 对 应 的 常量 数据 
// 这 里 取 = 6 
int boxCBufIndex = 6; 
cbAddress += boxCBufIndex*objCBByteSize; 











四 


D3D12_CONSTANT_BUFFER_VIEW_DESC cbvDesc ; 

cbvDesc.BufferLocation = cbAddress ; 

cbvDesc.SizeInBytes = d3dUtil::CalcConstantBufferByteSize(sizeof(Object- 
Constants ) ) ; 


md3dDevice->CreateConstantBufferView( 
&cbvDesc， 
mCbvHeap->GetCPUDescriptorHandleForHeapStart()); 


void BoxApp: :BuildRootSignature() 


{ 


可 


域 


类 似 地 认为 根 签名 

















// 着 色 吉 程序 一 般 需 要 以 资源 作为 输入 《例如 常量 缓冲 区 、 纹 理 、 采 样 器 等 ) 
// 根 签名 则 定义 了 着 色 器 程序 所 需 的 具体 资源 
// 如 果 把 着 色 器 程序 看 作 一 个 函数 ， 而 将 输入 的 资源 当 作 向 函数 传递 的 参数 数据 ， 那 么 便 









































// 定义 的 是 函数 签名 











// 根 参 数 可 以 是 描述 符 表 、 根 描述 符 或 根 常量 
CD3DX12_ROOT_PARAMETER slotRootParameter[1]; 

















// 创建 由 单个 CBV 所 组 成 的 描述 符 表 

CD3DX12 DESCRIPTOR RANGE cbvTable; 
cbvTable.Init(D3D12 DESCRIPTOR RANGE TYPE CBV, 1, 0); 
slotRootParameter[8].InitAsDescriptorTable(1, &cbvTable); 


// 根 签名 由 一 组 根 参数 构成 
CD3DX12_ROOT_SIGNATURE_DESC rootSigDesc(1, slotRootParameter, 8, nullptr 





D3D12_ROOT_SIGNATURE_ FLAG ALLOW_ INPUT_ASSEMBLER_ INPUT_LAYOUT); 












































// 用 





单个 寄存 器 槽 来 创建 一 个 根 签名 ， 该 槽 位 指 疝 一 个 仅 含有 单个 常量 缓冲 区 的 描述 符 区 




















Comptr serializedRootSig = nullptr; 
ComPtr errorBlob = nullptr; 
HRESULT hr = D3D12SerializeRootSignature(&rootSigDesc, D3D_ ROOT_SIGNATUR 


E_VERSION_ 1, 


serializedRootSig.GetAddressOf(), 
errorB1lob .GetAddressof() ) ; 


if(errorBlob != nullptr) 


} 


{ 


: :OutputDebugStringA((char*)errorBlob->GetBufferpPointer()); 


} 
ThrowIfFailed(hr); 


ThrowIfFailed(md3dDevice->CreateRootSignature( 


9， 


serializedRootSig->GetBufferPointer()， 


serializedRootSig->GetBufferSize()， 
IID_PPV_ARGS(&mRootSignature))); 


void BoxApp: :BuildShadersAndInputLayout() 


{ 


} 


HRESULT hr = S_OK; 


mvsByteCode = d3dUtil::CompileShader(L"Shaders\\color.hlsl", nullptr, 


"VS"， "vs 5 6") 5 


mpsByteCode = d3dUtil::CompileShader(L"Shaders\\color.hlsl", nullptr, 


"pS "ps 5 6"); 


mInputLayout = 
{ 


{ "POSITION", 60, DXGI_ FORMAT R32G32B32_FLOAT, 8，0,， 
D3D12_INPUT_CLASSIFICATION PER VERTEX DATA, 0 }, 

{ "COLOR", 0, DXGI_ FORMAT R32G32B32A32_FLOAT, 686，12,， 
D3D12_INPUT_CLASSIFICATION PER VERTEX_ DATA, © } 


}; 


void BoxApp: :BuildBoxGeometry() 


{ 


std::array vertices = 

{ 
Vertex({ XMFLOAT3(-1.6f， 
Vertex({ XMFLOAT3(-1.6f， 
Vertex({ XMFLOAT3(+1.6f， 
Vertex({ XMFLOAT3(+1.6f， 
Vertex({ XMFLOAT3(-1.6f， 
Vertex({ XMFLOAT3(-1.6f， 
Vertex({ XMFLOAT3(+1.6f， 
Vertex({ XMFLOAT3(+1.6f， 


}; 


std::array indices = 





// 立方 体 前 表面 


-1 


+1. 
+1. 
.Of ， 
.Of ， 
.Of ， 
.Of ， 
.Of ， 


-1 
-1 
+1 
+1 
-1 


.6f， 


6f， 
6f， 


-1 
-1 
-1 
-1 
+1 
+1 
+1 
+1 


.6f) ， 
.6f) ， 
.6f) ， 
.6f) ， 
.6f) ， 
.6f) ， 
.6f) ， 
.6f) ， 


XMFLOAT4(Colors : 
XMFLOAT4(Colors : 
XMFLOAT4(Colors : 
XMFLOAT4(Colors : 
XMFLOAT4(Colors : 
XMFLOAT4(Colors : 
XMFLOAT4(Colors : 
XMFLOAT4(Colors : 


:White) }), 
:Black) }), 
:Red) })， 
:Green) }), 
:Blue) }), 
:Yellow) }), 
:Cyan) }), 
:Magenta) }) 





~ 
~ 
< 
过 
亨 
未 
到 

















}; 


const UINT vbByteSize = (UINT)vertices.size() * sizeof(Vertex); 
const UINT ibByteSize = (UINT)indices.size() * sizeof(std::uint16 t); 


mBoxGeo = std::make unique(); 
mBoxGeo->Name = "boxGeo"; 


ThrowIfFailed(D3DCreateBlob(vbByteSize, &mBoxGeo->VertexBufferCPU)); 
CopyMemory (mBoxGeo->VertexBufferCPU->GetBufferpPointer(), 
vertices.data(), vbByteSize); 


ThrowIfFailed(D3DCreateBlob(ibByteSize, &mBoxGeo->IndexBufferCPU)); 
CopyMemory(mBoxGeo->IndexBufferCPU->GetBufferPointer()， 
indices.data(), ibByteSize); 


mBoxGeo->VertexBufferGPU = d3dUtil::CreateDefaultBuffer( 
md3dDevice.Get(), mCommandList.Get(), 
vertices.data(), vbByteSize, 
mBoxGeo->VertexBufferUploader); 


mBoxGeo->IndexBufferGPU = d3dUtil::CreateDefaultBuffer( 
md3dDevice.Get(), mCommandList.Get(), 
indices.data(), ibByteSize, 
mBoxGeo->IndexBufferUploader); 


mBoxGeo->VertexByteStride = sizeof(Vertex); 
mBoxGeo->VertexBufferByteSize = vbByteSize; 
mBoxGeo->IndexFormat = DXGI FORMAT R16 _UINT; 
mBoxGeo->IndexBufferByteSize = ibByteSize; 


SubmeshGeometry submesh ; 

submesh. IndexCount = (UINT)indices.sizel(); 
submesh .StartIndexLocation = 6 
submesh.BaseVertexLocation = 0; 


mBoxGeo->DrawArgs["box"] = submesh ; 


} 


void BoxApp: :BuildpSO() 

{ 
D3D12_ GRAPHICS PIPELINE STATE DESC psoDesc; 
ZeroMemory(&psoDesc, sizeof(D3D12 GRAPHICS PIPELINE STATE_DESC)); 
psoDesc.InputLayout = { mInputLayout.data(), (UINT)mInputLayout.size() } 


psoDesc.pRootSignature = mRootSignature.Get(); 
psoDesc.VS = 
{ 
reinterpret cast(mvsByteCode->GetBufferPpointer()), 
mvsByteCode->GetBufferSize() 


}; 
psoDesc.PS = 
{ 
reinterpret cast(mpsByteCode->GetBufferPpointer()), 
mpsByteCode->GetBufferSize() 
}; 


psoDesc.RasterizerState = CD3DX12 RASTERIZER DESC(D3D12 DEFAULT); 

psoDesc.BlendState = CD3DX12 BLEND DESC(D3D12 DEFAULT); 

psoDesc.DepthStencilState = CD3DX12 DEPTH_ STENCIL DESC(D3D12 DEFAULT); 

psoDesc.SampleMask = UINT MAX; 

psoDesc.PrimitiveTopologyType = D3D12 PRIMITIVE TOPOLOGY_TYPE_TRIANGLE; 

psoDesc.NumRenderTargets = 1; 

psoDesc.RTVFormats[6] = mBackBufferFormat; 

psoDesc.SampleDesc.Count = m4xMsaaState ? 4 : 1; 

psoDesc.SampleDesc.Quality = m4xMsaaState ? (m4xMsaaQuality - 1) : 6 

psoDesc.DSVFormat = mDepthStencilFormat; 

ThrowIfFailed(md3dDevice->CreateGraphicsPipelinestate(&psoDesc， 
IID_PPV_ARGS(&mPSO) ) ) ; 





一 一 一 一 
a Box Demo FPS:2502 Frame Time: 0.39968 (ms) 








图 6.7 “立方 体 ” 例 程 示意 图 


6.12 小结 


1. 除了 空间 位 置信 息 ，Direct3D 中 的 顶点 还 可 以 存储 其 他 类 型 的 
属性 数据 。 为 了 创建 自 定 义 的 顶点 格式 ， 我 们 首先 要 将 选 定 的 顶点 数据 
定义 为 一 个 结构 体 。 待 顶点 结构 体 定义 好 后 ， 便 可 用 输入 布局 描述 
(D3D12_INPUT_LAYOUT_DESC) 向 Direct3D 提 供 其 细节 。 输 入 布局 描 
述 由 两 部 分 组 成 : 一 个 D3D12_INPUT_ELEMENT_DESC 元 素 构成 的 数组 ， 
一 个 记录 该 数组 中 元 素 个 数 的 无 符号 整 
数 。D3D12_INPUT_ELEMENT_DESC 数 组 中 的 元 素 要 与 顶点 结构 体 中 的 成 
员 一 一 对 应 。 事 实 上 ， 和 输入 布局 描述 为 结构 
体 D3D12_ GRAPHICS_PIPELINE_STATE_DESC 中 的 一 个 字段 ， 这 就 是 
说 ， 它 实 为 PSO 的 一 个 组 成 部 分 ， 用 于 与 顶点 着 色 器 输入 签名 进行 格式 
的 比 对 验证 。 因 此 ， 当 PSO 与 泻 染 流水 线 绑 定时 ， 输 入 布局 也 将 以 PSO 
组 成 元 素 的 身份 随 PSO 与 泻 染 流水 线 的 IA 阶 段 相 绑 定 。 








2. 为 了 使 GPU 可 以 访问 顶点 /索引 数组 ， 便 需要 将 其 置 于 一 种 名 为 
缓冲 区 (buffer) 的 资源 之 内 。 顶 点 数据 与 索引 数据 的 缓冲 区 分 别称 为 
顶点 缓冲 区 (vertex buffer) 和 索引 缓冲 区 (index buffer) 。 绥 冲 区 用 
接口 ID3D12Resource 表 示 ， 要 创建 缓冲 区 资源 需要 填写 
D3D12_RESOURCE_DESC 结 构 体 ， 再 调 
用 ID3D12Device::CreateCommittedResource 方 法 。 顶 点 绥 冲 区 的 
视图 与 索引 缓冲 区 的 视图 分 别 用 D3D12_VERTEX_BUFFER_VIEW 与 
D3D12_INDEX_BUFFER_VIEW 结 构 体 加 以 描述 。 随 后 ， 即 可 通过 





ID3D12GraphicsCommandList::IASetVertexBuffers 方 法 

与 ID3D12GraphicsCommandList::IASetIndexBuffer 方 法 分 别 将 项 
点 绥 冲 区 与 索引 绥 冲 区 绑 定 到 泻 染 流水 线 的 IA 阶 段 。 最 后 ， 要 绘制 非 索 
引 (non-indexed)〉 描述 的 几何 体 〈 即 以 顶点 数据 来 绘制 的 几何 体 ) 可 借 
助 ID3D12GraphicsCommandList::DrawInstanced 方 法 ， 而 以 索引 描 
述 的 几何 体 可 

由 ID3D12GraphicsCommandList::DrawIndexedInstanced 方 法 进行 


绘制 。 


3. 顶点 着 色 器 是 一 种 用 HLSL 编 写 并 在 GPU 上 运行 的 程序 ， 它 以 单 
个 顶点 作为 输入 与 输出 。 每 个 待 绘制 的 顶点 都 要 流 经 顶点 着 色 器 阶段 。 
这 使 得 程序 员 能 够 在 此 以 顶点 为 基本 单位 进行 处 理 ， 继 而 获取 多 种 多 样 
的 泻 染 效 果 。 从 顶点 着 色 器 输出 的 数据 将 传 至 演 染 流水 线 的 下 一 个 阶 





洒 


4. 常量 缓冲 区 是 一 种 GPU 资源 (ID3D12Resource) ， 其 数据 内 容 

可 供 着 色 器 程序 引用 。 它 们 被 创建 在 上 传 堆 (upload heap) 而 非 默认 堆 

(default heap) 中 。 因 此 ， 应 用 程序 可 通过 将 数据 从 系统 内 存 复 制 到 显 
存 中 来 更 新 常量 缓冲 区 。 如 此 一 来 ，C++ 应 用 程序 就 可 与 着 色 器 通信 ， 
并 更 新 常量 缓冲 区 内 着 色 器 所 需 的 数据 。 例 如 ，C++ 程 序 可 以 借助 这 种 
方式 对 着 色 器 所 用 的 “世界 一 观察 一 投影 ” 算 阵 进行 更 改 。 在 此 ， 我 们 建 
议 读者 考量 数据 更 新 的 频繁 程度 ， 以 此 为 依据 来 创建 不 同 的 常量 缓冲 
区 。 效 率 乃 是 划分 常量 缓冲 区 的 动机 。 在 对 一 个 常量 缓冲 区 进行 更 新 的 
时 候 ， 其 中 的 所 有 变量 都 会 随 之 更 新 ， 正 所 谓 牵 一 发 而 动 全 身 。 因 此 ， 




















应 根据 更 新 频率 将 数据 有 效 地 组 织 为 不 同 的 常量 缓冲 区 ， 以 此 来 避免 无 
谓 的 元 余 的 更 新 ， 从 而 提高 效率 。 


5. 像素 着 色 器 是 一 种 用 HLSL 编 写 且 运行 在 GPU 上 的 程序 ， 它 以 经 
过 插值 计算 所 得 到 的 顶点 数据 作为 输入 ， 待 处 理 后 ， 再 输出 与 之 对 应 的 
一 种 颜色 值 。 由 于 硬件 优化 的 原因 ， 某 些 像素 片段 可 能 还 未 到 像素 着 色 
器 就 已 被 泻 桨 流水 线 别 除 了 《例如 采用 了 提前 深度 剔除 技术 ，early-z 
rejection ) 。 像 素 着 色 器 可 使 程序 员 以 像素 为 基本 单位 进行 处 理 ， 从 而 
获得 变化 万 干 的 泻 染 效果 。 从 像素 着 色 器 输出 的 数据 将 被 移交 至 泻 染 流 
水 线 的 下 一 个 阶段 。 








6. 大 多 数控 制图 形 流水 线 状态 的 Direct3D 对 和 象 都 被 指定 到 了 一 种 
称 作 流水 线 状态 对 象 (pipeline state object，PSO ) 的 集合 之 中 ， 并 
用 ID3D12Pipelinestate 接 口 来 表示 。 我 们 将 这 些 对 象 集 总 起 来 再 统 
一 对 泻 染 流水 线 进行 设置 ， 是 出 于 对 性 能 因素 的 考虑 。 这 样 一 来 ， 
Direct3D 就 能 验证 所 有 的 状态 是 否 彼 此 兼容 ， 而 驱动 程序 也 将 可 以 提前 
生成 硬件 本 地 指令 及 其 状态 。 


6.13 练习 





1， 写 出 与 下 列 顶 点 结构 体 所 对 应 的 D3D12_INPUT_ELEMENT_DESC 
数组 : 


struct Vertex 


{ 


XMFLOAT3 Pos; 
XMFLOAT3 Tangent,; 
XMFLOAT3 Normal; 
XMFLOAT2 Tex9 
XMFLOAT2 Tex1; 
XMCOLOR Color ; 





2. 改写 彩色 立方 体 滇 示 程 序 ， 这 次 使 用 两 个 顶点 缓冲 区 《以 及 两 
个 输入 槽 ) 来 回 泻 染 流 水 线 传送 顶点 数据 。 这 两 个 项 反 绥 冲 区 ， 一 个 用 
来 存储 位 置 元 素 ， 男 一 个 用 来 储存 闫 色 元 素 。 此 时 ， 我 们 应 当 利用 两 个 
顶点 结构 体 以 下 列 方式 分 别 存放 这 两 种 不 同 的 数据 : 





struct VPosData 


XMFLOAT3 Pos ; 
}; 


struct VColorData 


{ 
XMFLOAT4 Color; 


}; 





我 们 编写 的 D3D12_INPUT_ELEMENT_DESC 数 组 应 当 是 这 样子 的 : 





D3D12_INPUT_ELEMENT_DESC vertexDesc[] = 


{ 
{"POSITION", 0@, DXGI_ FORMAT R32G32B32_FLOAT, 86，0,， 


D3D12_INPUT_CLASSIFICATION PER VERTEX DATA, 08}, 
{"COLOR", 8，DXGI_FORMAT_R32G32B32A32_FLOAT，1，6， 
D3D12_INPUT_CLASSIFICATION PER VERTEX DATA, ©8} 


了 





此 后 ， 位 置 元 素 会 被 连接 到 输入 模 0， 而 颜色 元 素 将 被 连接 到 输入 
槽 1。 而 且 我 们 还 可 以 发 现 ， 对 于 这 两 种 元 素来 说 ， 它 们 的 
D3D12_INPUT_ELEMENT_DESC: :AlignedByte0ffset 字 上 段 皆 为 0。 这 是 
因为 位 置 和 颜色 这 两 种 元 素 不 再 共用 输入 槽 ， 而 是 独 理 各 自 的 输入 覃 。 
接 下 来 ， 我 们 再 
用 ID3D12GraphicsCommandList::IASetVertexBuffers 方 法 ， 将 两 
个 顶点 缓冲 区 分 别 与 寄存 器 槽 0 和 槽 1 相 绑 定 。 自 此 ，Direct3D 也 将 用 来 
自 不 同 输入 槽 的 元 素来 装配 顶点 〈 合 成 项 点 数据 ) 。 这 种 将 元 又 分 醒 存 
放 的 方法 也 可 用 于 程序 优化 。 例 如 ， 在 实现 阴影 贴图 算法 (shadow 
mapping algorithm， 或 称 阴影 映射 算法 ) 的 过 程 中 ， 我 们 需要 在 每 一 帧 
绘制 场景 两 次 : 第 一 次 是 从 光源 的 视角 泻 染 场 景 〈shadow pass， 阴 影 绘 
制 过 程 251) ， 第 二 次 是 从 主 摄像 机 的 视角 来 演 染 场景 (main pass， 主 
演 染 过 程 》。 阴 影 绘 制 过 程 只 需要 用 到 位 置 数 据 和 纹理 坐标 (为 了 对 几 
何 体 进行 alpha 测 试 ) 。 所 以 ， 我 们 可 以 将 顶点 数据 分 到 两 个 槽 中 : 一 个 
槽 容纳 位 置信 息 和 纹理 坐标 ， 另 一 个 槽 存储 顶点 的 其 他 属性 〈 如 法 癌 量 
和 切 癌 量 ) 。 如 此 一 来 ， 阴 影 绘 制 过 程 所 需 的 顶点 数据 只 用 一 个 数据 流 
即 可 《 存 有 位 置信 息 和 纹理 坐标 的 那 组 数据 ) ， 从 而 节省 阴影 绘制 过 程 
押 消 耗 的 数据 市 宽 。 而 主演 染 过 程 将 同时 使 用 这 两 个 顶点 输入 槽 ， 以 获 
得 所 需 的 全 部 顶点 数据 。 考 虑 到 程序 性 能 ， 建 议 您 尽量 减少 输入 覃 的 使 
用 数量 ， 最 好 不 要 多 于 3 个 。 

















3. 绘制 ; 


(a) 图 5.13a 中 所 示 的 扣 列 表 。 


(b) 图 5.13b 中 所 示 的 线条 带 。 


(Cc) 图 5.13c 中 所 示 的 线 列 表 。 


Cd) 图 5.13d 中 所 示 的 三 角形 带 。 


(Ce) 图 5.14a 中 所 示 的 三 角形 列表 。 





4. 构造 图 6.8 所 示 的 金字 塔 的 顶点 列表 和 索引 列表 ， 并 将 其 绘制 出 
来 : 令 塔 顶 为 红色 ， 其 他 底座 顶点 为 绿色 。 








图 6.8 ”构成 四 棱锥 的 三 角形 


5. 查阅 本 章 的 “Box”( 立 方 体 ) 演示 程序 代码 可 知 ， 我 们 只 对 立方 
体 的 顶点 处 指定 了 颜色 。 运 行 此 程序 后 会 发 现 立 方 体 却 处 处 都 呈现 出 了 
不 同 的 色彩 ， 那 么 问题 就 来 了 : 构成 立方 体 表面 的 三 角形 内 的 像素 是 怎 


样 得 到 各 自 像 素颜 色 的 呢 ? 





6. 修改 “Box" 演 示 程 序 ， 在 顶点 着 色 器 将 诸 顶 点 变换 到 世界 空间 之 
前 ， 先 对 顶点 应 用 下 列 变 换 。 








vin.PosL.xy += 8.5f*sin(vin.PosL.x)*sin(3.6f*gTime); 





vin.PosL.z *= 0.6f + 0.4f*sin(2.6f*gTime); 


为 此 ， 我 们 需要 在 程序 中 添加 一 个 常量 绥 冲 区 变量 gTime， 此 变量 
为 函数 GameTimer: :TotalTime() 的 当前 值 。 这 段 代 码 将 通过 时 间 函 数 
驱动 各 顶点 ， 使 立方 体 的 形状 随 正 弦 函 数 周 期 性 地 发 生 改变 。 


7. 将 立方 体 和 练习 4 中 金字 塔 的 顶点 合并 到 一 个 大 的 顶点 缓冲 区 
内 ， 再 将 两 者 的 索引 合并 至 一 个 大 的 索引 绥 冲 区 中 (但 是 不 要 更 新 索引 
值 )。 接 着 ， 再 根据 上 述 改动 来 依次 调整 调 
用 ID3D12GraphicsCommandList::DrawIndexedInstanced 方 法 的 参 
数 ， 以 正确 地 绘制 立方 体 和 金字 塔 。 并 通过 设置 世界 变换 矩阵 ， 使 两 者 
在 世界 空间 中 互 不 相交 。 


8. 修改 “Box” 演 示 程 序 ， 以 线 框 模式 来 演 染 立方 体 。 


9. 修改 “Box” 演 示 程 序 ， 首 先 禁用 背面 吻 除 
(D3D12_CULL_MODE_NONE 〉 并 运行 程序 ， 随 后 ， 再 代 以 正面 吻 除 
(D3D12_CULL_MODE_FRONT) 试 之 。 用 线 框 模式 输出 程序 的 绘图 效 
果 ， 可 便于 我 们 观察 不 同 剔除 模式 之 间 的 绘制 差别 。 


10. 如 果 在 茶 些 情况 下 需要 缩减 顶点 占用 内 存 的 大 小 ， 那 么 不 妨 将 


颜色 的 精度 从 128 位 减少 到 32 位 。 修 改 “Box” 演 示 程 序 ， 将 其 顶点 结构 体 
中 128 位 的 颜色 值 调 整 为 32 位 颜色 值 。 此 时 ， 顶 点 结构 体 及 其 对 应 的 项 
点 输入 描述 将 变 为 : 





struct Vertex 

{ 
XMFLOAT3 Pos; 
XMCOLOR Color; 


}; 


D3D12_INPUT_ELEMENT_DESC vertexDesc[] = 


{"POSITION", 0, DXGI_ FORMAT R32G32B32_FLOAT, 86,，0,， 
D3D12_INPUT_ CLASSIFICATION PER VERTEX DATA, 08}, 

{"COLOR", 0, DXGI_ FORMAT_ B8G8R8A8_UNORM, 8, 12, 
D3D12_INPUT_CLASSIFICATION PER VERTEX DATA, 8} 





这 时 ， 我 们 应 使 用 DXGI_FORMAT_B8G8R8A8_UNORM 格 式 (8 位 蓝 
色 、8 位 绿色 、8 位 红色 以 及 8 位 alpha 值 ) 来 表示 颜色 元 素 。 它 对 应 于 常 
用 的 32 位 图 像 颜 色 格 式 ARGB， 但 颜色 通道 的 顺序 是 否 看 起 来 有 点 奇 
怪 ? 这 是 因为 DXGI_FORMAT 符 号 所 列 的 值 在 内 存 中 是 用 小 站 (Jittle- 
endian) 字 节 序 来 表示 的 。 在 小 端 字 节 序 表示 法 中 ， 多 字 节 的 数据 字 
(data word) 是 从 最 低 有 效 字 节 开 始 写 至 最 高 有 效 字 节 的 ， 这 就 是 为 什 
么 格式 ARGB 在 内 存 中 被 表示 为 BGRA; 它 的 最 低 有 效 字 节 处 于 最 低 内 
存 地 址 ， 而 最 高 有 效 字 节 则 列 于 最 高 内 存 地 址 。 












































11. 考虑 下 列 C++ 顶 点 结构 体 : 


struct Vertex 


{ 


XMFLOAT3 Pos; 
XMFLOAT4 Color; 
}; 





(a) 输入 布局 描述 中 的 元 系 顺 序 需要 与 项 点 结构 体 中 的 元 素 顺 序 
相 匹 配 吗 ? 即 下 列 顶 点 声明 对 于 上 述 顶 点 结构 体 来 说 是 否 恰当 呢 ? 通过 
实验 来 寻找 答案 ， 并 给 出 它 能 工作 或 出 错 的 原因 。 





D3D12_INPUT_ELEMENT_DESC vertexDesc[] = 


{ 
{"COLOR", 0, DXGI FORMAT R32G32B32A32_FLOAT, 68，12,， 


D3D12_INPUT_CLASSIFICATION PER VERTEX_ DATA, 06}, 
{"POSITION", 0, DXGI_ FORMAT R32G32B32_FLOAT, 686，0,， 
D3D12_INPUT_CLASSIFICATION PER VERTEX_ DATA, 06}, 





}; 








(b) 顶点 着 色 右 结构 体 中 的 元 素 顺序 是 否 需要 与 C++ 顶点 结构 体 
中 的 元 素 顺序 相 匹 配 呢 ? 即 下 列 顶 点 着 色 器 结构 体 是 否 能 与 上 述 C++ 顶 
点 结构 体 一 起 协同 工作 呢 ? 通过 实验 来 寻求 答案 ， 并 给 出 它 能 否 正常 工 
作 的 原因 。 





struct VertexIn 


float4 Color : COLOR; 
float3 Pos : POSITION; 
}; 





.设置 视 口 ， 使 它 对 准 后 台 缓 冲 区 的 左 半 部 分 。 


13. 借助 裁剪 测试 ， 剔 除 后 台 绥 冲 区 中 心 宽 为 mnClientwidth/2、 
高 为 ClientHeight/2 这 一 和 矩形 范围 之 外 的 所 有 像素 。 注 意 ， 要 做 到 
一 点 ， 我 们 还 需 以 D3D12_RECT 结 构 体 描述 裁剪 范围 ， 并 调 
用 RSSetScissorRects 方 法 对 此 进行 设 定 。 


14. 用 像素 着 色 器 实现 出 可 变色 立方 体 的 效果 。 在 顶点 着 色 器 和 像 


素 着 色 器 中 ， 通 过 使 用 常量 绥 冲 区 以 及 简单 的 控制 函数 ， 使 立方 体 的 闫 
色 随 着 时 间 的 推移 而 平滑 地 发 生变 化 ，。 


15， 修 改 “Box” 演 示 程 序 中 的 像素 着 色 器 如 下 : 


float4 PS(VertexOut pin) : SV_Target 


clip(pin.Color.r - 8.5f); 
return pin.Color; 





运行 该 示例 ， 并 猜想 内 置 函 数 clip 起 到 了 什么 作用 。 


16. 修改 “Box” 演 示 程 序 中 的 像素 着 色 器 ， 根 据 插值 项 点 颜色 与 在 
常量 绥 冲 区 中 指定 的 颜色 gPulseColor， 计 算出 两 者 间 平 滑 的 过 渡 颜 
色 。 为 了 实现 这 个 目标 ， 我 们 需要 在 应 用 程序 端 更 新 此 常量 缓冲 区 。 修 
改 后 的 HLSL 代 码 中 的 常量 缓冲 区 和 像素 着 色 器 应 当 如 下 : 


cbuffer cbPerObject : register(b6) 


float4x4 gWorldViewProj; 
float4 gPulseColor; 
float gTime; 

}; 


float4 PS(VertexOut pin) : SV_Target 


{ 
const float pi = 3.14159; 














// 随 着 时 间 流 逝 ， 令 正弦 函数 的 值 在 [0,1] 区 间 内 周期 性 地 变化 
float s = 6.5f*sin(2*gTime - 0.25f*pi)+0.5f; 

















// 基于 参数 s 在 pin.Color 与 gPulseColor 之 间 进 行 线性 插值 
float4 c = lerp(pin.Color, gPulseColor, s); 











return c; 





其 中 的 变量 gTime 对 应 于 函数 GameTimer: :TotalTime() 给 出 的 当 





[1] 此 处 提 及 的 “签名 〈signature) ” 即 着 色 器 的 输入 或 输出 参数 列表 。 
[2] 预览 版 中 为 D3D12_INPUT_PER_VERTEX_DATA。 
[3] 预览 版 中 为 D3D12_INPUT_PER_INSTANCE_DATA。 


[4] 在 正式 版 

中 ，ID3D12CommandList: :CopySubresourceRegion (这 是 预览 版 中 
的 函数 名 ) 函数 已 细 分 为 主要 负责 复制 纹理 的 函 

数 CopyTextureRegion〔 即 也 可 复制 缓冲 区 资源 ) ， 与 负 员 复制 缓冲 
区 数据 的 函数 CopyBufferRegion， 它 们 钼 继承 自 
ID3D12GraphicsCommandList 接 口 。 而 且 UpdateSubresources 函 数 
亦 有 修改 ， 此 函数 共有 3 种 实现 ， 第 一 种 以 一 块 分 配 的 内 存 真正 地 实现 
了 将 资源 从 上 传 堆 复 制 到 默认 堆 ， 而 另外 两 种 则 分 别 先 在 堆 或 栈 中 分 配 
复制 过 程 中 所 需 的 内 存 ， 再 调用 第 一 种 实现 去 执行 实际 的 复制 操作 。 最 
后 ， 上 传 堆 内 的 数据 最 终 是 被 复制 到 以 
CD3DX12_TEXTURE_COPY_LOCATION Dst 表 示 的 默认 堆 中 ， 而 不 

















是 mBuffer 中 。 
[5] 在 预览 版 中 ， 其 名 为 D3D12_VERTEX_BUFFER_DESC。 


[6] Direct3D 11 提 供 了 多 达 7 种 绘制 调用 方法 ， 而 Direct3D 12 则 将 其 精 
简 为 3 种 ， 且 都 为 实例 化 绘制 方法 。 文 中 介绍 的 是 采用 顶点 来 绘制 几何 





体 的 方法 ， 另 一 种 
ID3D12GraphicsCommandList::DrawIndexedInstanced 为 需要 提供 


索引 数据 的 绘制 方法 ， 后 文 会 讲 到 。 


[7] 希望 更 为 深入 地 学 习 HLSL 语 言 ， 可 以 访问 GitHub 网 站 。 它 基本 上 
代表 了 HLSL 着 色 模 型 (Shader Model，SM) 的 最 新 动向 。 如 果 想 要 更 
进一步 ， 还 可 以 党 试 阅 读 《Asm Shader Reference》 (bb219840， 尺 管 
现在 的 Direct3D 版 本 事实 上 已 不 再 文 持 直接 编写 汇编 代码 了 ， 不 过 在 程 
序 的 优化 方面 可 能 会 有 帮助 ) 。 





[8] 系统 值 语义 是 在 Direct3D 10 引 入 的 。Direct3D 10 及 其 后 续 版 本 中 的 
SV_Position 语 义 ， 与 Direct3D 9 中 的 POSITION 语义 等 价 。 其 它 语义 的 
对 照 关系 与 使 用 方法 请 参考 《Semantics》 (pbb569647) 。 


[9] 简 而 言 之 ， 在 顶点 着 色 器 运行 之 前 ， 每 个 顶点 中 的 数据 都 会 载 入 
顶点 着色 器 的 ) 输入 寄存 器 内 ， 供 其 执行 期 间 使 用 。 输 入 布局 中 的 格 
式 定 义 的 是 : 数据 进入 输入 寄存 占 之 前 的 类 型 (具体 来 讲 ， 输 入 布局 摘 
述 的 是 : 在 泻 染 流水 线 中 顶点 着 色 器 之 前 的 输入 奢 配 器 阶段 内 ， 输 入 组 
冲 区 《 即 顶点 缓冲 区 与 索引 缓冲 区 ) 的 数据 类 型 ) 。 而 输入 签名 定义 的 
是 : 在 执行 项 点 着 色 器 程序 的 过 程 中 ， 将 数据 从 输入 寄存 器 中 读 取 时 所 
视 作 的 类 型 。 由 于 二 者 中 存在 元 素 格 式 相 寞 的 情况 ， 在 编译 期 间 才 触 友 
了 这 一 警告 。 如 果 是 程序 员 故 意 而 为 之 则 可 视而不见 ， 人 否则 需要 使 二 者 
相 匹 配 。 例 如 ， 大 家 可 以 尝试 按 上 面 元 素 格 式 不 匹配 的 方式 进行 绘制 ， 
看 看 最 终 效 果 。 再 想 一 想 为 什么 会 出 现 这 种 情况 ， 利 用 前 文中 提 到 的 调 
试 工具 或 其 他 手段 验证 一 下 。 

















[10] 这 里 所 提 到 的 “像素 ”是 最 终 写 入 后 台 绥 冲 区 中 数据 ， 而 “像素 片 
段 ? 是 写 入 此 “像素 ”过程 中 的 竞争 者 。 与 前 文中 讲 采样 时 的 术语 是 两 回 
事 。 








[11] 着 色 器 模型 定义 了 HLSL 的 编写 规范 ， 确 定 了 其 内 置 函 数 CHLSL 
intrinsic functions)、 着 色 器 属性 等 一 切 语言 元 素 。 虽 然 Direct3D 11.3 与 
Direct3D 12 的 发 行 时 间 相 近 ， 且 部 分 官方 文档 宣称 “Direct3D 11.3 文 持 独 

色 器 模型 5.1”， 但 实际 并 非 如 此 。 着 色 器 模型 5.1 与 6.0 为 Direct3D 12 所 独 
有 。 我 们 也 可 以 通过 DirectX 所 提供 的 工具 dxcapsviewer.exe (位 于 “系统 
盘 :\Program Files (x86)NWindows Kits\10\bin\* 下 的 文件 夹 ) 来 验证 这 一 
点 。 多 说 一 句 ， 就 这 一 点 也 可 以 从 侧面 看 出 ， 微 软 公 司 并 没有 抛弃 
Direct3D 11， 甚 至 在 后 面 继续 将 其 更 新 到 11.4， 使 之 与 Direct3D 12 的 功 
能 更 加 接近 ， 并 令 二 者 (乃至 Direct3D 10 与 Direct2D) 之 间 可 以 进行 互 
操作 (interop〉。 男 外 ， 前 文中 也 提 到 了 微软 开源 的 着 色 器 编译 器 ， 它 
目前 已 支持 SM 6.2， 并 附加 了 一 些 实 用 工具 。 


[12] 关于 此 处 的 子 资源 索引 ， 请 参考 12.3.4 节 。 


[13] Direct3D 12 不 i 数 在 多 线程 中 调用 的 安全 
性 ， 还 令 map 函 数 可 角 套 调用 。 第 一 次 调用 map 函 数 时 ，Direct3D 会 在 
CPU 端 分 配 一 块 虚拟 内 存 地 址 范围 ， 用 来 映射 GPU 中 的 资源 。 而 最 后 一 
次 调用 unmap 函 数 时 ， 则 会 释放 这 块 CPU 虚拟 地 址 范围 。map 函 数 会 在 
必要 时 对 CPU 缓存 执行 invalidate 操 作 《〈 标 记 相 关 绥 存 无 效 ， 令 CPU 读 取 
主 存 中 的 数据 ) ， 以 此 使 CPU 端 可 以 读 取 GPU 端 对 这 段 地 址 内 容 所 做 的 
修改 ;相反 地 ，unmap 函 数 则 会 在 必要 时 对 CPU 缓存 进行 fush 操 作 〈 令 


缓存 中 的 数据 写 回 主 存 ) ， 以 令 GPU 端 可 以 读 取 CPU 端 对 这 段 地 址 内 容 
所 做 的 修改 。 


[14] 寄存 器 槽 就 是 问 着 色 器 传递 资源 的 手段 ，register(* 坟 中 * 表 示 寄 存 
器 传递 的 资源 类 型 ， 可 以 是 [《〈 表 示 着 色 需 资源 视图 ) 、s《〈 和 采样 器 ) 、 
u 无 序 访问 视图 ) 以 及 b《〈 和 常量 缓冲 区 视图 ) ，# 则 为 所 用 的 寄存 右 编 


呵 


写 。 





[15] Direct3D 12 规 定 ， 必 须 先 将 根 签名 的 描述 布局 进行 序列 化 处 理 
Cserialize) ， 待 其 转换 为 以 TD3DB1lob 接 口 表示 的 序列 化 数据 格式 后 ， 
才 可 将 它 传 入 CreateRootSsignature 方 法 ， 正 式 创 建 根 签名 。 在 此 ， 
可 以 设置 将 根 签名 按 何 种 版 本 〈1.0，1.1) 进行 序列 化 处 理 。 在 
Windows 10 (14393) 版 以 后 ， 可 以 
D3D12SerializeVersionedRootSignature 方 法 代 之 。 





[16] 自 Windows 10 周 年 更 新 版 的 SDK (Windows 10 Anniversary Update 
SDK，1607) 起 ， 编 译 嚣 会 默认 将 根 签名 按 版 本 1.1 进 行 编译 ， 用 户 可 
通过 对 编译 器 进行 配置 使 它 创 建 1.0 版 本 的 根 签名 ( 详 见 Root Signature 
Version 1.1 中 的 Version management 部 分 ，mt709473) 。 根 签名 1.1 版 相 
对 于 1.0 版 而 言 会 把 擅 述 符 与 数据 分 为 static 与 Volatile 两 种 ， 从 而 使 图 形 
驱动 层 的 行为 得 到 优化 。 而 且 ， 在 不 支持 根 签名 1.1 版 本 的 操作 系统 上 
使 用 1.1 版 本 的 根 签名 会 出 现 问 题 。 





[17] 目前 最 新 的 着 色 器 模型 版 本 是 6.4， 需 用 前 文 注释 中 的 DirectX 
Shader Compiler 进 行 编译 。 痢 色 器 模型 6.0 一 6.4 添 加 了 许多 新 的 内 置 函 


数 与 数据 类 型 。 读 者 可 以 从 msdn 与 微软 GitHub 上 DirectXShaderCompiler 
项 目的 示例 及 wiki 文档 中 获得 更 多 相关 信息 《使 用 该 版 本 着 色 器 模型 有 
SDK 版 本 与 特性 级 别 等 限制 ) 。 


[18] 如 之 前 所 注 ，CD3D12_DEFAULT 在 后 续 的 SDK 版 本 中 已 更 名 
为 CD3DX12_DEFAULT。 


[19] 在 预览 版 中 ，D3D12_FILL_MODE 中 的 枚 举 项 以 D3D12_FILL_* 作 
为 前 级 ， 且 D3D12_CULL_MODE 中 的 枚 举 项 以 D3D12_CULL_* 作 为 前 级 ， 
而 CD3DX12_DEFAULT 则 名 为 CD3D12_DEFAULT。 


[20] 文中 并 没有 对 D3D12_GRAPHICS_PIPELINE_ STATE_DESC 结 构 体 
中 的 参数 完全 介绍 ， 全 书 也 未 曾 用 到 这 些 参数 ， 可 能 是 作者 因此 而 未 


de 


写 。 





[21] 如 之 前 所 注 ， 代 码 中 的 

CD3DX12_ RASTERIZER_DESC、 CD3DX12 BLEND_DESC 

与 CD3DX12_DEPTH_STENCIL_DESC 等 辅助 方法 在 预览 SDK 版 本 中 为 
CD3D12 前 绥 。 


[22] 在 Windows 10 中 ， 图 形 调 试 工具 已 改 为 按 可 选 安 装 的 形式 出 现 。 
在 Windows 10 环 境 下 第 一 次 运行 Direct3D 调 试 版 程序 ， 可 能 会 得 到 相关 
的 错误 提示 。 这 时 可 在 设置 /系统 /应 用 和 功能 /管理 可 选 功能 中 〈 视 具体 
系统 版 本 而 定 〉 找 到 “图 形 工具 ”安装 。 有 时 也 会 发 生 找 不 到 此 安装 项 的 
情况 。 此 时 ， 可 在 管理 员 吴 份 的 命令 行 工 具 〈cmd) 中 用 命令 Dism 
/online /add-capability /capabilityname:Tools.Graphics.DirectX~~~~0.0.1.0 





来 安装 。 也 可 在 微软 官网 下 载 相应 的 HLK 补 充 测试 包 
CHLK_GRFX_FOD.zip， 注 意 与 自己 的 系统 版 本 匹配 ) 进行 离线 安装 。 


[23] 由 于 摄像 机 涉及 环绕 物体 旋转 等 操作 ， 所 以 先 利用 球 坐 标 表示 变 
换 《〈 可 将 摄像 机 视 为 针对 目标 物体 的 可 控 “ 侦 得 卫 星 ”， 用 鼠标 调整 摄像 
机 与 物体 间 的 距离 (也 就 是 球面 半径 〉 以 及 观察 角 度 ) ， 再 将 其 转换 为 
簿 卡 儿 化 标 的 表示 更 为 方便 。 而 这 一 摄像 机 系统 也 被 称 为 旋转 摄像 机 系 
统 (orbiting camera system， 也 有 作 环 绕 摄 像 机 系统 ) 。 顺 便 提 一 句 ， 

除了 上 述 两 种 坐标 系 之 外 ， 圆 柱 坐 标 系 〈cylindrical coordinate system， 
也 有 作 柱 面 坐 标 系 ) 有 时 也 会 派 上 用 场 ， 因 此 掌握 这 3 种 坐标 系 间 的 转 
换 对 实际 应 用 也 会 大 有 神 益 。 


[24] 这 里 使 用 D3D11_PRIMITIVE_TOPOLOGY_TRIANGLELIST 对 于 运行 
结果 无 碍 ， 但 是 为 了 程序 的 统一 性 ， 最 好 将 其 设置 
为 D3D_PRIMITIVE_TOPOLOGY_TRIANGLELIST。 


[25] 在 早期 的 Direct3D 版 本 中 ， 存 在 一 种 效果 框架 (effects 

framework) 。 用 户 借助 效果 文件 (effect file〉 即 可 实现 所 需 的 泻 染 效 
果 。 效 果 文 件 中 存 有 一 个 或 多 个 technique， 一 个 technique 就 是 实现 某 种 
特效 的 具体 处 理 手 段 〈 即 一 个 technique 对 应 一 种 特效 ) ， 每 个 technique 
都 由 一 个 或 多 个 pass 构 成 〈 即 该 technique 的 实现 由 其 下 这 些 pass 来 具体 
执行 ) 。a (rendering) pass 一 词 常 被 称 作 “ 一 趟 ”一 通 ” 或 “一 届 ” 绘 制 过 程 
(也 有 译作 绘制 路 径 、 演 染 通道 等 ) 。 一 个 pass 则 含有 绘制 过 程 中 所 需 
的 各 种 泻 染 状态 以 及 着 色 器 等 。 借 助 多 pass 即 可 演 染 出 用 户 所 需 的 各 种 
特效 。 虽 然 这 一 框架 在 Direct3D 12 中 已 不 复 存 在 了 ， 但 是 借助 多 pass 实 





现 特效 这 一 技术 手段 却 依然 适用 。 


第 7 章 ”利用 Direct3D 绘 制 几何 体 ( 续 ) 


本 章 将 介绍 一 些 此 书后 面 常会 用 到 的 绘图 模式 。 首 先 讲解 与 绘图 优 
化 相关 的 内 容 ， 此 处 涉及 “ 帧 资源 (frame resources) ”等 概念 。 各 采用 
帧 资源 ， 我 们 就 得 修改 程序 中 的 泻 染 循环 ， 这 样 做 所 带 来 的 好 处 是 不 必 
在 每 一 帧 都 刷新 命令 队列 ， 继 而 改善 CPU 和 GPU 的 利用 率 。 接 下 来 ， 我 
们 会 提出 泻 染 项 (render item) 的 概念 ， 并 解释 如 何 基 于 更 新 频率 来 划 
分 常量 数据 。 此 外 ， 我 们 将 研究 根 签名 的 更 多 细节 ， 并 学 习 其 他 两 种 根 
参数 类 型 : 根 描述 符 和 根 常量 。 最 后 ， 我 们 还 会 展示 怎样 绘制 更 为 复杂 
的 物体 。 完 成 本 章 的 学 习 后 ， 读 者 将 能 够 绘制 出 形 如 山川 的 表面 ， 还 有 
加 台 、 球 体 以 及 模拟 波浪 运动 的 动画 。 














学 习 目 标 : 


1. 学 会 一 种 无 须 每 帧 都 要 刷新 命令 队列 的 泻 染 流程 ， 由 此 来 优化 
程序 的 性 能 。 





2. 了 解 男 外 两 种 根 签 名 参数 类 型 : 根 摘 述 符 和 根 常 量 。 








3. 探索 如 何在 程序 中 生成 和 绘制 常见 的 几何 体 ， 如 栅 格 、 圆 台 和 
球体 。 


4. 研究 怎样 通过 动态 顶点 缓冲 区 来 更 新 CPU 中 的 顶点 数据 ， 并 且 
加 GPU 上 传 项 点 的 新 位 置信 息 。 


7.1 帧 资源 


首先 回顾 一 下 4.2 节 中 描述 的 CPU 与 GPU 并 行 工 作 的 情形 : CPU 除 
了 要 执行 其 他 必要 的 工作 之 外 ， 还 要 ) 构建 并 提交 命令 列表 ， 而 GPU 则 
负责 处 理 命令 队列 中 的 各 种 命令 。 我 们 的 目标 是 令 CPU 和 GPU 持 续 工 
作 ， 从 而 充分 利用 系统 当中 的 可 用 硬件 资源 。 到 目前 为 止 ， 我 们 的 演示 
程序 在 绘制 每 一 帧 时 都 会 将 CPU 和 GPU 进行 一 次 同步 。 这 样 做 的 原因 有 
两 个 : 


1. 在 GPU 未 结束 命令 分 配器 (command allocator) 中 所 有 命令 的 执 
行 之 前 ， 不 能 将 它 重 置 。 如 寿 不 进行 同步 ， 那 么 在 GPU 完 成 当前 第 n 帧 
的 处 理 之 前 ，CPU 可 能 会 继续 执行 下 一 帧 (第 na 二 1 正 ) 的 相关 工作 : 如 
果 CPU 在 第 n + 1 帧 中 重 置 了 命令 分 配器 ， 那 么 ，GPU 当 前 还 未 处 理 的 命 
令 就 会 被 清除 掉 。 





2. 在 GPU 未 完成 与 常量 缓冲 区 相关 的 绘制 命令 之 前 ，CPU 不 可 更 
新 这 些 常量 缓冲 区 。 这 种 情景 在 4.2.2 小 节 和 图 4.7 中 有 相应 的 描述 。 假 
设 我 们 不 进行 同步 ， 那 么 在 GPU 结束 当前 第 " 帧 的 处 理 之 前 ，CPU 可 能 
会 继续 执行 第 "+ ! 帧 的 相关 工作 : 如 果 CPU 在 第 ”+ 1 帧 中 履 写 了 常量 组 
冲 区 内 的 数据 ， 而 GPU 还 未 曾 引 用 第 n 帧 中 的 常量 缓冲 区 数据 去 执行 给 
制 调用 ， 那 么 ， 在 GPU 正 式 绘制 第 n 帧 画面 时 ， 常 量 绥 冲 区 内 所 存 的 将 
不 是 此 帧 所 需 的 数据 。 


所 以 ， 我 们 在 每 帧 绘制 的 结尾 都 会 调 


用 D3DApp: :FlushCommandQueue 函 数 ， 以 确保 GPU 在 每 一 帧 都 能 正确 
完成 所 有 命令 的 执行 。 这 种 解决 方案 虽然 奏效 却 效率 低下 ， 原 因 如 下 : 





1. 在 每 帧 的 起 始 阶段 ，GPU 不 会 执行 任何 命令 ， 因 为 等 竺 它 处 理 
的 命令 队列 空空 如 也 。 这 种 情况 将 持续 到 CPU 构建 并 提交 一 些 供 GPU 执 
行 的 命令 为 止 。 


2. 在 每 帧 的 收尾 阶段 ，CPU 会 等 待 GPU 完成 命令 的 处 理 。 





所 以 ，CPU 和 GPU 在 每 一 帧 都 存在 各 自 的 空 耳 时间。 


解决 此 问题 的 一 种 方案 是 : 以 CPU 每 帧 都 需 更 新 的 资源 作为 基本 元 
素 ， 创 建 一 个 环形 数组 (circular array， 也 有 译作 循环 数组 ) 。 我 们 称 
这 些 资源 为 师资 源 〈frame resource) ， 而 这 种 循环 数组 通常 是 由 3 个 帧 
资源 元 素 所 构成 的 。 该 方案 的 思路 是 : 在 处 理 第 n 帧 的 时 候 ，CPU 将 周 
而 复 始 地 从 帧 资源 数组 中 获取 下 一 个 可 用 的 〈 即 没 被 GPU 使 用 中 的 ) 帧 
资源 。 趁 着 GPU 还 在 处 理 此 前 帧 之 时 ，CPU 将 为 第 n 帧 更 新 资源 ， 并 构 
建 和 提交 对 应 的 命令 列表 。 随 后 ，CPU 会 继续 针对 第 ”+ 1 帧 执行 同样 的 
工作 流程 ， 并 不 断 重 复 下 去 。 如 果 帧 资源 数组 共有 3 个 元 素 ， 则 令 CPU 
比 GPU 提 前 处 理 两 帧 ， 以 确保 GPU 可 持续 工作 。 下 面 所 列 的 是 帧 资源 类 
的 例 程 ， 在 本 章 中 我 们 将 利用 “Shapes”( 不 同形 状 的 几何 体 ) 程序 配合 
演示 。 由 于 在 此 例 中 CPU 只 震 修 改 常 量 缓冲 区 ， 所 以 程序 中 的 帧 资源 类 
只 含有 第 量 缓冲 区 。 








// 存 有 CPU 为 构建 每 帧 命令 列表 所 需 的 资源 








// 其 中 的 数据 将 依 程 序 而 异 ， 这 取决 于 实际 绘制 所 需 的 资源 
struct FrameResource 


{ 


public: 


FrameResource(ID3D12Device* device, UINT passCount, UINT objectCount); 
FrameResource(const FrameResource& rhs) = delete; 

FrameResource& operator=(const FrameResource& rhs) = delete; 
~FrameResource(); 














Ln 








// 在 GPU 处 理 完 与 此 命令 分 配器 相关 的 命令 之 前 ， 我 们 不 能 对 它 进 行 午 置 。 
// 所 以 每 一 帧 都 要 有 它们 自己 的 命令 分 配器 


Microsoft: :WRL: :ComPptr<ID3D12CommandAllocator> CmdListAlloc; 















































// 在 GPU 执 行 完 引用 此 常量 缓冲 区 的 命令 之 前 ， 我 们 不 能 对 它 进行 更 新 。 
// 因此 每 一 帧 都 要 有 它们 自己 的 常量 缓冲 区 
std: :unique ptr<UploadBuffer<PassConstants>> PassCB = nullptr; 

std: :unique ptr<UploadBuffer<ObjectConstants>> ObjectCB = nullptr; 
























































// 通过 围栏 值 将 命令 标记 到 此 围栏 点 ， 这 使 我 们 可 以 检测 到 GPU 是 否 还 在 使 用 这 些 帧 资源 
UINT64 Fence = 0; 
}; 


FrameResource: :FrameResource(ID3D12Device* device, UINT passCount, UINT 
objectCount) 
{ 
ThrowIfFailed(device->CreateCommandAllocator( 
D3D12 COMMAND LIST_ TYPE_DIRECT, 
IID PPV_ARGS(CmdListAlloc.GetAddressOof()))); 


PassCB = std::make unique<UploadBuffer<PassConstants>>(device, 
passCount, true); 

ObjectCB = std::make unique<UploadBuffer<ObjectConstants>>(device, 
objectCount, true); 


} 


FrameResource: :~FrameResource() { } 





据 此 ， 我 们 的 应 用 程序 类 (ShapesApp〉 将 实例 化 一 个 由 3 个 帧 资源 
元 素 所 构成 的 网 量 ， 并 留 有 特定 的 成 员 变 量 来 记录 当前 的 帧 资源 : 














const int gNumFrameResources = 3; 

std: :Vector<std: :unique_ptr<FrameResource>> mFrameResources; 
FrameResource* mCurrFrameResource = nullptr; 

int mCurrFrameResourceIndex = 60; 


void ShapesApp::BuildFrameResources() 


{ 


for(int i = 6; i «< gNumFrameResources; ++i) 


mFrameResources.push back(std: :make unique<FrameResource>( 
md3dDevice.Get(), 1, (UINT)mAllRitems.size())); 





现在 ，CPU 端 处 理 第 n 帧 的 算法 是 这 样 的 : 





void ShapesApp::Update(const GameTimer& gt) 


{ 

// 循环 往复 地 获取 帧 资源 循环 数组 中 的 元 素 

mCurrFrameResourceIndex = (mCurrFrameResourceIndex + 1) % gNumFrameResou 
rces; 

mCurrFrameResource = mFrameResources[mCurrFrameResourceIndex].get(); 

















// GPU 端 是 否 已 经 执行 完 处 理 当 前 帧 资源 的 所 有 命令 呢 ? 
// 如 果 还 没有 就 令 CPU 等 待 ， 直 到 GPU 完 成 命令 的 执行 并 抵达 这 个 围栏 点 
if(mCurrFrameResource->Fence != 0 && 
mCommandQueue->GetLastCompletedFence() < mCurrFrameResource->Fence) 
{ 
HANDLE eventHandle = CreateEventEx(nullptr, false, false, EVENT ALL AC 
CESS); 
ThrowIfFailed(mCommandQueue->SetEventOnFenceCompletion( 
mCurrFrameResource->Fence, eventHandle));[1] 
WaitForSingleObject(eventHandle, INFINITE); 
CloseHandle(eventHandle); 





























// [...] 更 新 mCurrFrameResource 内 的 资源 (例如 常量 缓冲 区 ) 











void ShapesApp::Draw(const GameTimer& gt) 





// [...] 构建 和 提交 本 帧 的 命令 列表 














// 增加 围栏 值 ， 将 命令 标记 到 此 围栏 点 


mCurrFrameResource->Fence = ++mCurrentFence ; 








// 向 命令 队列 添加 一 条 指令 来 设置 一 个 新 的 围栏 点 

// 由 于 当前 的 GPU 正 在 执行 绘制 命令 ， 所 以 在 GPU 处 理 完 sSignal( ) 函数 之 前 的 所 有 命令 以 
前 ， 

// 并 不 会 设置 此 新 的 围栏 点 


mCommandQueue->Signal(mFence.Get(), mCurrentFence); 















































// 值得 注意 的 是 ，GPU 此 时 可 能 仍然 在 处 理 上 一 帧 数据 ， 但 是 这 也 没什么 问题 ， 因 为 我 们 








这 些 操 作 并 没有 
// 影响 与 之 前 帧 相关 联 的 帧 资源 
} 

















不 难看 出 ， 这 种 解决 方案 还 是 无 法 完全 避免 等 待 情况 的 发 生 。 如 果 
两 种 处 理 器 处 理 帧 的 速度 差距 过 大 ， 则 前 者 终 将 不 得 不 等 待 后 来 者 妃 
上 ， 因 为 差距 过 大 将 导致 帧 资源 数据 被 错误 地 复写 。 如 果 GPU 处 理 命令 
的 速度 快 于 CPU 提交 命令 列表 的 速度 ， 则 GPU 会 进入 空闲 状态 。 通 第 来 
讲 ， 知 要 尝试 淋 演 尽 致 地 发 挥 系统 图 形 处 理 方面 的 能 力 ， 就 应 当 避 免 此 
情况 的 发 生 ， 因 为 这 并 没有 充分 利用 GPU 资源 。 此 外 ， 如 果 CPU 处 理 帧 
的 速度 总 是 遥遥 领先 于 GPU， 则 CPU 一 定 存在 等 待 的 时 间 。 而 这 正 是 我 
们 所 期 待 的 情景 ， 因 为 这 使 GPU 被 完全 调动 了 起 来 ， 而 CPU 多 出 来 的 空 
闲 时 间 总 是 可 以 被 游戏 的 其 他 部 分 所 利用 ， 如 AI《〈 人 工 智 能 ) 、 物 理 模 
拟 以 及 游戏 业务 逻辑 等 。 














因此 ， 如 果 说 采用 多 个 帧 资源 也 无 法 避免 等 待 现象 的 发 生 ， 那 么 它 
对 我 们 究竟 有 何 用 处 呢 ? 答案 是 : 它 使 我 们 可 以 持续 向 GPU 提供 数据 。 
也 就 是 说 ， 当 GPU 在 处 理 第 n 帧 的 命令 时 ，CPU 可 以 继续 构建 和 提交 绘 
制 第 ”+ 1 帧 和 第 ”+ 2 帧 所 用 的 命令 。 这 将 令 命令 队列 保持 非 空 状态 ， 从 
而 使 GPU 总 有 任务 去 执行 。 


7.2 ” 泻 染 项 

绘制 一 个 物体 需要 设置 多 种 参数 ， 例 如 绑 定 顶点 缓冲 区 和 索引 缓冲 
区 、 绑 定 与 物体 有 关 的 常量 数据 、 设 定 图 元 类 型 以 及 指定 
DrawIndexedInstanced 方 法 的 参数 。 随 着 场景 中 所 绘 物体 的 逐渐 增 
多 ， 如 果 我 们 能 创建 一 个 轻 量 级 结构 来 存储 绘制 物体 所 需 的 数据 ， 那 真 
是 极 好 的 ; 由 于 每 个 物体 的 特征 不 同 ， 绘 制 过 程 中 所 需 的 数据 也 会 有 所 
变化 ， 因 此 该 结构 中 的 数据 也 会 因 具 体 程序 而 异 。 我 们 把 单 次 绘制 调用 
过 程 中 ， 需 要 癌 泻 染 流 水 线 提交 的 数据 集 称 为 泻 染 项 (render item) 。 
对 于 当前 的 演示 程序 而 言 ， 泻 染 项 RenderItem 结 构 体 如 下 : 
































// 存储 绘制 图 形 所 需 参数 的 轻 量 级 结构 体 。 它 会 随 着 不 同 的 应 用 程序 而 有 所 差别 


struct RenderItem 


RenderItem() = default; 


// 描述 物体 局 部 空间 相对 于 世界 空间 的 世界 矩阵 
// 它 定 义 了 物体 位 于 世界 空间 中 的 位 置 、 朝 向 以 及 大 小 
XMFLOAT4X4 World = MathHelper::Identity4x4(); 











// 用 已 更 新 标志 (dirty flag) 来 表示 物体 的 相关 数据 已 发 生 改变 ， 这 意味 着 我 们 此 时 

// 冲 区 。 由 于 每 个 FrameResource 中 都 有 一 个 物体 常量 缓冲 区 ， 所 以 我 们 必须 对 每 个 Fra 
meResource 

// 都 进行 更 新 。 即 ， 当 我 们 修改 物体 数据 的 时 候 ， 应 当 按 NumFramesDirty = gNumFram 
eResources 

// 进行 设置 ， 从 而 使 每 个 帧 资源 都 得 到 更 新 


int NumFramesDirty = gNumFrameResources; 



























































// 该 索引 指向 的 GPU 常量 缓冲 区 对 应 于 当前 泻 染 项 中 的 物体 常量 缓冲 区 
UINT ObjCBIndex = -1; 








四 





// 此 演 染 项 参与 绘制 的 几何 体 。 注 意 ， 绘 制 一 个 几何 体 可 能 会 用 到 多 个 演 染 项 
MeshGeometry* Geo = nul1Lptr; 








// 图 元 拓扑 


D3D12_PRIMITIVE_TOPOLOGY PrimitiveType = D3D_PRIMITIVE_TOPOLOGY_TRIANGLE 


LIST; 





// DrawIndexedInstanced 方 法 的 参数 
UINT IndexCount = 6; 

UINT StartIndexLocation = 0 
BaseVertexLocation = 9; 


int 





我 们 的 应 用 程序 将 根据 各 泻 染 项 的 绘制 目的 ， 把 它们 保存 在 不 同 的 
器 量 里 。 即 按照 不 同 PSO 流水 线 状 态 对 象 ) 所 需 的 泻 染 项 ， 将 它们 划 
分 到 不 同 的 向 量 之 中 。 


// 存 有 所 有 演 染 项 的 向 量 











std: :Vector<std: :unique ptr<RenderItem>> mAllRitems; 


// 根 提 
std: :vector<RenderItem*> mOpaqueRitems; 
std: :vector<RenderItem*> mTransparentRitems; 








PSO 来 划分 泻 染 项 





7.3” 淮 染 过 程 中 所 用 到 的 第 量 数据 


从 7.1 节 中 可 以 看 到 ， 我 们 在 自己 实现 的 FrameResource 类 中 引进 
了 一 个 新 的 背 量 缓冲 区 : 


std: :unique ptr<UploadBuffer<PassConstants>> PassCB = nullptr; 


随 着 演示 代码 复杂 度 的 不 断 增 加 ， 该 缓冲 区 中 存储 的 数据 内 容 〈 例 
如 观察 位 置 、 观 察 和 矩阵 与 投影 算 阵 以 及 与 屏 秦 〈( 演 染 目标 ) 分 辨 紊 等 相 
关 的 信息 ) 会 根据 特定 的 泻 染 过 程 (rendering pass) 而 确定 下 来 。 其 中 
也 包含 了 与 游戏 计时 有 关 的 信息 ， 它 们 是 着 色 器 程序 中 要 访问 的 极 有 用 
的 数据 。 注 意 ， 我 们 的 演示 程序 可 能 不 会 用 到 所 有 的 常量 数据 ， 但 是 
们 的 存在 却 使 工作 变 得 更 加 方便 ， 而 且 提 供 这 些 额 外 的 数据 也 只 需 少量 
开销 。 例 如 ， 0 宣 梁 目标 的 尺寸 ， 但 当 要 实现 菜 些 
后 期 处 理 效 果 之 时 ， 这 个 pan 


























cbuffer cbPass : register(b1) 
{ 


float4x4 gView; 
float4x4 gInvView; 
float4x4 gProj; 
float4x4 gInvProj; 
float4x4 gViewProj; 
float4x4 gInvViewProj; 


float3 8gEyePosW; 

float cbPerObjectPad1; 
float2 gRenderTargetSize; 
float2 gInvRenderTargetSize; 
float gNearz; 

float gFarz; 

float gTotalTime; 

float gDeltaTime; 





此 时 ， 我 们 也 已 修改 了 物体 常量 缓冲 区 〈 即 cbPerObject) ， 使 之 
仅 存 储 一 个 与 物体 有 关 的 常量 。 就 目前 的 情况 而 言 ， 为 了 绘制 物体 ， 与 
之 唯一 相关 的 第 量 就 是 它 的 世界 矩阵 : 








cbuffer cbPerobject : register(b6) 
{ 


float4x4 gWorld; 
}; 








我 们 做 出 上 述 调整 的 思路 为 : 基于 资源 的 更 新 频率 对 常量 数据 进行 
分 组 。 在 每 次 泻 染 过 程 (render pass) 中 ， 只 需 将 本 次 所 用 的 常量 
(cbPass) 更 新 一 次 ; 而 每 当 某 个 物体 的 世界 矩阵 发 生 改 变 时 ， 只 需 
更 新 该 物体 的 相关 常量 (cbPerobject) 即 可 。 如 果 场 景 中 有 一 个 静态 
物体 ， 比 如 一 棵 树 ， 则 只 需 对 它 的 物体 常量 缓冲 区 设置 一 次 〈 树 的 ) 世 
界 窍 阵 ， 而 后 就 再 也 不 必 对 它 进 行 更 新 了 。 在 我 们 的 演示 程序 中 ， 将 通 
过 下 列 方法 来 更 新 泻 染 过 程 帅 量 缓冲 区 以 及 物体 常量 缓冲 区 。 在 绘制 每 
一 帧 画面 时 ， 这 两 个 方法 都 将 被 Update 函 数 调用 一 次 。 











void ShapesApp::UpdateObjectCBs(const GameTimer& gt) 
{ 


auto currObjectCB = mCurrFrameResource->ObjectCB. get(); 


for(auto& e : mAllRitems) 

{ 
// 只 要 常量 发 生 了 改变 就 得 更 新 常量 缓冲 区 内 的 数据 。 而 且 要 对 每 个 帧 资源 都 进行 更 新 
if(e->NumFramesDirty > 6) 


{ 
XMMATRIX world = XMLoadFloat4x4(&e->World); 
























































ObjectConstants objConstants; 
XMStoreFloat4x4(&objConstants .World, XMMatrixTranspose(worl1d)); 


currObjectCB->CopyData(e->0bjCBIndex, objConstants); 














// 还 需要 对 下 一 个 FrameResource 进 行 更 新 


e->NumFramesDirty--; 


void ShapesApp::UpdateMainpassCB(const GameTimer& gt) 


{ 
XMMATRIX view 


XMMATRIX proj 


XMLoadFloat4x4(&mView); 
XMLoadFloat4x4(&mProj); 


XMMATRIX viewProj = XMMatrixMultiply(view, proj); 

XMMATRIX invView = XMMatrixInverse(&XMMatrixDeterminant(view), view); 

XMMATRIX invProj = XMMatrixInverse(&XMMatrixDeterminant(proj), proj); 

XMMATRIX invViewProj = XMMatrixInverse(&XMMatrixDeterminant(viewProj), 
viewProj); 


XMStoreFloat4x4(&mMainpassCB.View, XMMatrixTranspose(view)); 

XMStoreFloat4x4(&mMainpassCB.InvView, XMMatrixTranspose(invView)); 

XMStoreFloat4x4(&mMainpassCB.Proj, XMMatrixTranspose(proj)); 

XMStoreFloat4x4(&mMainpassCB.InvProj, XMMatrixTranspose(invProj)); 

XMStoreFloat4x4(&mMainpassCB.ViewProj, XMMatrixTranspose(viewProj)); 

XMStoreFloat4x4(&mMainpassCB.InvViewProj, XMMatrixTranspose(invViewpProj) 

); 

mMainpassCB.EyePosW = mEyePos; 

mMainpassCB.RenderTargetSize = XMFLOAT2( (float)mClientWidth, (float) 
mClientHeight); 

mMainpassCB.InvRenderTargetSize = XMFLOAT2(1.6f / mClientwidth, 1.6f 
/ mClientHeight); 

mMainpassCB.Nearz = 1.6f; 

mMainPassCB.FarZ = 10060.0f; 

mMainPassCB.TotalTime = gt.TotalTime(); 

mMainpassCB.DeltaTime = gt.DeltaTime(); 


auto currPassCB = mCurrFrameResource->PassCB. get(); 
currPpassCB->CopyData(60, mMainpassCB); 





随 着 这 些 常 量 缓冲 区 结构 的 改变 ， 我 们 也 要 对 顶点 着 色 器 进行 相应 





VertexOut VS(VertexIn vin) 
{ 


VertexOut vout; 











// 将 项 点 变换 到 齐 次 裁 艾 空间 





float4 posW = mul(float4(vin.PosL, 1.6f), gWorld); 
vout.PosH = mul(posW, gViewpProj); 


// 直接 向 像素 着 色 器 传递 顶点 的 颜色 数据 


Vvout .Color = vin.Color; 





return vout; 





此 调整 会 引起 每 个 顶点 都 要 额外 进行 一 次 同 量 与 官 阵 的 乘法 运算 ， 
这 对 现代 的 GPU 来 说 都 是 小 蘑 一 夸 ， 因 为 它 有 着 极 其 强大 的 计算 能 


现在 ， 着 色 器 所 期 望 的 输入 资源 已 发 生 了 改变 ， 因 此 我 们 需要 相应 
地 调整 根 签名 来 使 之 获取 所 需 的 两 个 描述 符 表 《此 时 ， 我 们 的 着 色 器 程 
序 圾 要 获取 两 个 描述 符 表 ， 因 为 这 两 个 CBV 常量 缓冲 区 视图 ) 有 着 不 
同 的 更 新 频率 一 一 泻 染 过 程 CBV 仪 需 在 每 个 演 染 过 程 中 设置 一 次 ， 而 物 
体 CBV 则 要 针对 每 一 个 泻 染 项 进行 配置 ) : 








CD3DX12_DESCRIPTOR_RANGE cbvTable6; 
cbvTable6.Init(D3D12_DESCRIPTOR_RANGE_TYPE_CBV，1，6); 


CD3DX12_DESCRIPTOR_RANGE cbvTablel; 
cbvTable1.Init(D3D12_DESCRIPTOR_RANGE_TYPE_CBV，1，1); 





// 根 参 数 可 能 是 描述 符 表 、 根 擅 述 符 或 根 第 量 
CD3DX12 ROOT_ PARAMETER slLotRootParameter[2]; 























// 创建 根 CBV 
slotRootParameter[8].InitAsDescriptorTable(1, &cbvTable®Q); 
slotRootParameter[1].InitAsDescriptorTable(1, &cbvTable1); 








// 根 签名 由 一 系列 根 参数 所 构成 
CD3DX12_ROOT_SIGNATURE_DESC rootSigDesc(2, slotRootPparameter, 0, nullptr, 
D3D12 ROOT_SIGNATURE_ FLAG ALLOW INPUT_ ASSEMBLER_ INPUT_LAYOUT); 














注 意 Note 友和 


不 要 在 着 色 器 内 使 用 过 多 的 常量 缓冲 区 。 根 据 [Thibieroz13] 提 出 的 
建议 ， 出 于 性 能 的 考虑 ， 常 量 绥 冲 区 的 数量 以 少 于 5 个 为 宜 。 


7.4 不 同形 状 的 几何 体 


在 本 节 中 ， 我 们 将 展示 如 何 创 建 不 同形 状 的 几何 体 ， 如 椭 球 体 、 球 
体 、 柱 体 ( 通 过 调整 圆柱 体 的 上 下 两 底 即 可 创建 出 圆 人 台 和 圆锥 体 )。 这 
些 几 何 体 对 于 绘制 天 空 穹顶 (sky dome， 即 描述 游戏 中 玩家 头顶 的 天 空 
部 分 ， 也 有 译作 天 空 穹 、 天 和 罕 等 ) 、 图 形 程 序 调试 、 碰 撞 检测 的 可 视 化 
以 及 延迟 演 染 〈deferred rendering) 是 有 极 大 神 益 的 。 比 如 说 ， 我 们 可 
以 先 将 正在 制作 中 的 游戏 角色 简化 泻 染 成 球体 ， 以 供 调 试 检测 。 











我 们 将 程序 性 几何 体 〈procedural geometry， 也 有 译作 过 程 化 几何 
体 。 这 个 词 的 译 法 较 多 ， 大 意 束 是 “根据 用 户 提 供 的 参数 以 程序 上 自动 生 
成 对 应 的 几何 体 *”) 的 生成 代码 放 入 GeometryGenerator 类 
(GeometryGenerator.h/.cpp〉 中。GeometryGenerator 是 一 个 工具 类 ， 
用 于 生成 如 栅 格 、 球 体 、 柱 体 以 及 长 方 体 这 类 简单 的 几何 体 ， 在 我 们 的 
演示 程序 中 将 常常 见 到 它们 的 喘 影 。 此 类 将 数据 生成 在 系统 内 存 中 ， 而 
我 们 必须 将 这 些 数 据 复制 到 顶点 缓冲 区 和 索引 缓冲 区 
内 。GeometryGenerator 类 还 可 创建 出 一 些 后 续 章 市 要 用 到 的 顶点 数 
据 ， 由 于 我 们 当前 的 演示 程序 中 还 用 不 到 它们 ， 所 以 暂时 不 会 将 这 些 数 
据 复制 到 顶点 缓冲 区 。MeshData 是 一 个 诅 套 在 GeometryGenerator 类 
中 用 于 存储 顶点 列表 和 索引 列表 的 简易 结构 体 : 














class GeometryGenerator 


{ 

public: 
using uint16 = std::uint16 t; 
using uint32 = std::uint32 七 ; 


struct Vertex 


Vertex(){} 

Vertex( 
const DirectX: :XMFLOAT3& p， 
const DirectX: :XMFLOAT3& n， 
const DirectX: :XMFLOAT3& 七 ， 
const DirectX: :XMFLOAT2& uv) 
Position(p)， 
Normal(n), 
TangentU(t), 
TexC(uv){} 

Vertex( 
float px, float py, float pz, 
float nx, float ny, float nz, 
float tx, float ty, float tz, 
float u, float v) : 
Position(px,py,pz)， 
Normal(nx,ny,nz), 
TangentU(tx, ty, tz), 
TexC(u,v){} 


DirectX: :XMFLOAT3 Position; 
DirectX: :XMFLOAT3 Normal; 
DirectX: :XMFLOAT3 TangentU; 
DirectX: :XMFLOAT2 TexC; 


}; 


struct MeshData 
{ 


std: :vector<Vertex> Vertices ; 
std: :vector<uint32> Indices32; 


std: :vector<uint16>& GetIndices16() 


{ 
if(mIndices16.empty()) 


{ 


mIndices16.resize(Indices32.size()); 
for(size t i = 6; i «< Indices32.size(); ++i) 
mIndices16[i] = static cast<uint16>(Indices32[i]); 
} 


return mIndices16; 


} 


private: 


std: :Vector<uint16> mIndices16; 


}; 





7.4.1 生成 柱 体 网 格 





在 定义 一 个 柱 体 时 ， 需 要 指定 其 项、 底面 半径 ， 高 度 ， 切 片 数量 
Cslice count， 即 将 截面 分 割 的 块 数 ) ， 以 及 堆 营 层 数 (stack count， 即 
横 回 切割 的 层 数 ) ， 如 图 7.1 所 示 。 程 序 中 的 柱 体 呈 圆 台 形状 ， 因 而 就 
此 展开 讨论 。 我 们 将 圆 台 的 构成 分 为 侧面 几何 体 ， 顶 面 几 何 体 以 及 底面 
几何 体 3 个 部 分 。 


切片 顶 面 半径 







分 R、、、 
高 度 





底面 半径 


图 7.1 左 侧 圆 台 被 分 为 8 个 切片 ， 划 为 4 层 。 右 侧 圆 台 的 被 分 为 16 个 切片 ， 划 为 8 层 。 切 请 数量 

和 堆 登 层 数控 制 着 构成 圆 台 的 三 角形 密集 程度 ， 三 角形 越 多 则 所 绘图 形 越 接近 预定 的 几何 体 。 

注意 ， 圆 台 顶 面 半径 和 底面 半径 是 不 同 的 ， 所 以 我 们 可 以 借 此 创建 出 趋向 于 锥 体 的 几何 体 ， 而 
不 仅仅 是 “ 正 ?圆柱 体 











7.4.1.1 柱 体 的 侧面 几何 体 


我 们 要 生成 的 是 中 心 ( 即 /2 高 度 处 截面 的 中 心 点 ) 位 于 原点 ， 且 
旋转 轴 平 行 于 y 轴 的 圆 台 。 从 图 7.1 中 可 以 看 出 ， 圆 台 的 所 有 顶点 都 列 于 
其 各 层 侧面 的 “ 环 * 上 ， 共 有 stackCount + 1 环 ， 而 每 个 环 上 的 顶点 数量 都 
为 sliceCount。 相 邻 环 的 半径 差 为 
Ar = (topRadius-bottomRadius)/stackCount。 如 果 从 底面 上 的 环 开始 用 索 
引 来 0 表示 ， 那 么 第 ; 环 的 半径 就 是 ri =bottom fadius+i Ar ， 且 第 i 环 的 高 


hh 
» hi 一 二 于 1 SE 、 >» Ss 号 » 
度 值 为 "3 了 "(可见 ，1/2 高 度 以 下 为 负 值 ，1/2 高 度 以 上 为 正 


值 ) ， 其 中 的 Ai 是 每 层 的 高 度 ，/ 为 圆 台 的 高 度 。 由 此 可 知 ， 生 成 圆 台 
的 基本 思路 是 过 历 每 个 环 ， 并 生成 列 于 环 上 的 各 个 项 点。 下 面 给 出 此 算 
法 的 实现 : 








GeometryGenerator: :MeshData 
GeometryGenerator: :CreateCylinder( 
float bottomRadius, float topRadius, 
float height, uint32 sliceCount, uint32 stackCount) 


MeshData meshData; 


// 
// 构建 堆 登 层 
// 


| 





float stackHeight = height / stackCount; 














// 计算 从 下 至 上 过 历 每 个 相 邻 分 层 时 所 需 的 半径 增 量 
float radiusStep = (topRadius - bottomRadius) / stackCount; 











uint32 ringCount = stackCount+1; 











// 从 底面 开始 ， 由 下 至 上 计算 每 个 堆 登 层 环 上 的 顶点 坐标 
for(uint32 i = 6;j i < ringCount; ++i) 
{ 
float y 
float r 














-0.5f*height + i*stackHeight; 
bottomRadius + i*radiusStep; 


// 环 上 的 各 个 顶点 





float dTheta 
for(uint32 j 


{ 


2.6f*XM PI/sliceCount; 
6;j j <= sliceCount; ++j) 


Vertex vertex; 


float c 
float s 


cosf(j*dTheta); 
sinf(j*dTheta); 


vertex.Position = XMFLOAT3(r*c, y, r*s); 


vertex.TexC.x = (float)j/sliceCount; 
vertex.TexC.y = 1.6f - (float)i/stackCount; 































































































// 可 以 像 下 面 那 样 以 参数 化 (parameterized) 的 方式 来 计算 圆 台 顶点 ， 我 们 引入 
与 纹理 坐标 v 方 

// 向 相同 的 参数 v， 从 而 使 副 切线 (bitangent， 相 关 概 念 见 19.3 节 ) 与 纹理 坐标 v 

// 的 方向 相同 

// 设 re 为 底面 半径 ，r1 为 项 面 半径 

// y(v) = h - hv 其 中 v 位 于 区 间 [8,1] 

// r(v) = ri + (re@-r1i)v 

// 

// x(t, v) = r(v)*cos(t) 

// y(t, v)= h - hv 

// z(t, v) = r(v)*sin(t) 

// 

// dx/dt = -r(v)*sin(t) 

// dy/dt = 6 

// dz/dt = +r(v)*cos(t) 

// 

// dx/dv = (r@-r1)*cos(t) 

// dy/dv = -h 

// dz/dv = (re@-r1)*sin(t) 

// 此 为 单位 长 度 





vertex.TangentU = XMFLOAT3(-s, 0.6f, c); 


float dr = bottomRadius-topRadius; 
XMFLOAT3 bitangent(dr*c, -height, dr*s); 


XMVECTOR TT 


XMLoadFloat3(&vertex.TangentU); 


XMVECTOR B = XMLoadFloat3(&bitangent); 
XMVECTOR N = XMVector3Normalize(XMVector3Cross(T, B)); 
XMStoreFloat3(&vertex.Normal, N); 


meshData.Vertices.push back(vertex); 





从 上 述 代码 中 可 以 看 出 ， 每 个 环 上 的 第 一 个 顶点 与 最 后 一 个 顶点 在 
位 置 上 是 重合 的 ， 但 是 二 者 的 纹理 坐标 却 并 不 相同 。 只 有 这 样 做 才能 保 
证 在 圆 合 上 绘制 出 正确 的 纹理 。 








注 意 Note 


由 GeometryGenerator::CreateCylinder 方 法 创建 的 其 他 顶点 数 
据 《〈 如 法 向 量 和 纹理 坐标 ) 对 后 续 章 节 中 的 演示 程序 而 言 是 不 可 或 缺 
的 ， 但 我 们 现在 还 不 会 用 到 它们 。 














观察 图 7.2 可 知 ， 由 每 个 分 层 以 及 切片 分 割 出 的 侧面 块 都 是 一 个 四 
边 形 《由 两 个 三 角形 构成 ) 。 而 以 第 ; 层 与 第 7 块 切片 所 确定 下 来 的 侧面 
块 中 的 两 个 三 角形 的 索引 分 别 为 : 

AAABC=(in+j,(i+1) :n+7,(i 十 1):n 十 7 十 1) 
AACD=(in+j,(i+1):n+j+1,i:n++j+1) 

其 中 ，z 是 每 个 环 上 的 顶点 数量 。 因 此 ， 求 取 圆 台 侧 面 块 上 所 有 三 

角形 索引 的 主要 思路 是 : 过 历 每 个 扒 登 层 和 每 个 切片 ， 并 运用 上 述 公式 


进行 计算 。 




















// +1 是 希望 让 每 环 的 第 一 个 顶点 和 最 后 一 个 顶点 重合 ， 这 是 因为 它们 的 纹理 坐标 并 不 相同 
uint32 ringVertexCount = sliceCount+1; 


























// 计算 每 个 侧面 块 中 三 角形 的 索引 
for(uint32 i = 6; i «< stackCount; ++i) 
{ 
for(uint32 j = 8; j < sliceCount; ++j) 
{ 
meshData.Indices32.push back(i*ringVertexCount + j); 
meshData.Indices32.push back((i+1)*ringVertexCount + j); 
meshData.Indices32.push back((i+1)*ringVertexCount + j+1); 

















meshData.Indices32.push back(i*ringVertexCount + j); 
meshData.Indices32.push back((i+1)*ringVertexCount + j+1); 
meshData.Indices32.push back(i*ringVertexCount + j+1); 
} 
} 


BuildCylinderTopCap(bottomRadius, topRadius, height, 
sliceCount, stackCount, meshData); 

BuildCylinderBottomCap(bottomRadius, topRadius, height, 
sliceCount, stackCount, meshData); 


return meshData; 








图 7.2 ”顶点 44、B、C'、D 分 别 位 于 第 i 环 、 第 i 十 1 环 以 及 第 ] 块 切片 所 合围 的 侧面 块 之 中 


7.4.1.2 柱 体 的 端面 几何 体 





生成 圆 合 端面 的 几何 体 ， 相 当 于 在 其 顶 面 和 底面 的 堆 面 上 切割 出 多 
个 三 角形 ， 使 之 台 近 一 个 圆 形 : 





void GeometryGenerator: :BuildCylinderTopCap( 
float bottomRadius, float topRadius, float height, 
uint32 sliceCount, uint32 stackCount, MeshData& meshData) 


uint32 baseIndex = (uint32)meshData.Vertices.sizel(); 


float y = 6.5f*height; 
float dTheta = 2.6f*XM PI/sliceCount; 

















// 使 圆 台 端面 环 上 的 首尾 顶点 重合 ， 因 为 这 两 个 顶点 的 纹理 坐标 和 法 线 是 不 同 的 
for(uint32 i = 6j i <= sliceCount; ++i) 
{ 

float x = topRadius*cosf(i*dTheta); 














float z = topRadius*sinf(i*dTheta); 























// 根据 圆 台 的 高 度 使 项 面 纹理 坐标 的 范围 按 比例 缩小 
float u = x/height + 86.5f; 
float v = z/height + 0.5f; 

















meshData.Vertices.push back( 
Vertex(x, y, z, 86.6f, 1.6f, 86.6f, 1.6f, 60.6f, 68.6f, u, v) ); 


} 
// 项 面 的 中 心 顶点 


meshData.Vertices.push back( 
Vertex(60.6f, y, 0.6f, 8.6f, 1.6f, 68.6f, 1.6f, 8.6f, 0.6f, 68.5f, 0.5f) 





); 
// 中 心 顶点 的 索引 值 


uint32 centerIndex = (uint32)meshData.Vertices.size()-1; 


for(uint32 i = 6;j i «< sliceCount; ++i) 


meshData.Indices32.push back(centerIndex); 
meshData.Indices32.push back(baseIndex + i+1); 
meshData.Indices32.push back(baseIndex + i); 
} 
} 





生成 圆 台 底 面 的 代码 与 之 相似 。 


7.4.2 ”生成 球体 网 格 


欲 定 义 一 个 球体 ， 就 要 指定 其 半径 、 切 片 数量 及 其 堆 合 层 数 ， 如 图 
7.3 所 示 。 除 了 每 个 环 上 的 半径 是 依 三 角 函 数 非 线性 变化 ， 生 成 球体 的 
算法 与 生成 圆 台 的 算法 非常 相近 。 我 们 将 把 
GeometryGenerator: :CreateSphere 方 法 的 代码 留 给 读者 自行 研究 。 
最 后 ， 值 得 一 提 的 是 ， 若 采用 不 等 比 缩放 世界 变换 ， 即 可 将 球体 转换 为 
椭 球 体 。 








图 7.3 ” 柱 体 的 切片 与 分 层 思想 也 同样 可 以 应 用 到 球体 上 ， 借 此 来 控制 球体 的 曲面 细 分 级 别 


7.4.3 生成 几何 球体 网 格 





观察 图 7.3 可 知 ， 构 成 球体 的 三 角形 面积 并 不 相同 ， 这 在 菜 些 情景 
中 并 非 我 们 所 愿 。 相 对 而 言 ， 几 何 球 体 (geosphere〉 利 用 面积 相同 且 边 
长 相等 的 三 角形 来 交 近 球体 ， 如 图 7.4 所 示 。 


OOKKKA 
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图 7.4 ”通过 反复 细 分 并 将 新 生成 的 顶点 重新 投影 到 球面 上 ， 便 可 以 近似 地 表示 一 个 几何 球体 
为 了 生成 几何 球体 ， 我 们 以 一 个 正二 十 面体 作为 基础 ， 细 分 其 上 的 


三 角形 ， 再 根据 给 定 的 半径 问 球 面 投影 新 生成 的 项 点 。 上 反复 重复 这 个 过 
程 ， 便 可 以 提高 该 几何 球体 的 曲面 细 分 程度 。 





图 7.5 展 示 了 如 何 将 一 个 三 角形 细 分 为 4 个 大 小 相等 的 小 三 角形 。 不 
难 发 现 ， 新 生成 的 项 点 都 位 于 原始 三 角形 边 上 的 中 点 。 先 将 顶点 投影 到 


/ 





单位 球面 上 ， 再 利用 /进行 标量 乘法 ， ” “llv， 即 可 把 新 顶点 都 投影 
到 半径 为 /的 球体 之 上 。 


pi Pp1 


mo mi 


Pp pb; Do m2 D2 














图 7.5 “将 一 个 三 角形 细 分 为 4 个 等 面积 小 三 角形 的 过 程 





























相应 的 代码 如 下 : 





GeometryGenerator: :MeshData 
GeometryGenerator : :CreateGeosphere(float radius, uint32 numSubdivisions) 


{ 
MeshData meshData; 











// 确定 细 分 的 次 数 


numSubdivisions = std::min<uint32>(numSubdivisions, 6u); 

















// 通过 对 一 个 正二 十 面体 进行 曲面 细 分 来 和 逼 近 一 个 球体 


























Const float X 
const float Z 


= 6.525731f; 

= 6.856651f; 

XMFLOAT3 pos[12] = 

{ 
XMFLOAT3(-X, 6.6f, Z), XMFLOAT3(X，68.6f，Z)， 
XMFLOAT3(-X，6.6f，-Z)，XMFLOAT3(X，6.6f，-Z)， 
XMFLOAT3(6.6f，Z，X)， XMFLOAT3(6.6f，Z，-X)， 
XMFLOAT3(6.6f，-Z，X)， XMFLOAT3(86.6f，-Z，-X)， 
XMFLOAT3(Z，X，68.6f)， XMFLOAT3(-Z，X，68.6f)， 
XMFLOAT3(Z，-X，6.6f)， XMFLOAT3(-Z，-X，6.6f) 


uint32 k[66] = 


{ 
1,4,0,， 4,9,8， 4,5,9， 8,5,4, 1,8,4， 
1,16,8，16,3,8，8,3,5， 3,2,5， 3,7,2, 
3,16,7，16,6,7，6,11,7，6,6,11，6,1,6， 
10,1,6, 11,0,9, 2,11,9, 5,2,9, 11,2,7 
}; 


meshData.Vertices.resize(12); 
meshData.Indices32.assign(&k[6]，&k[66]); 


for(uint32 i = 6;j i < 12; ++i) 
meshData.Vertices[i].Position = pos[i]; 


for(uint32 i = 6; i «< numSubdivisions; ++i) 
Subdivide(meshData); 




















// 将 每 一 个 顶点 都 投影 到 球面 ， 并 推导 其 对 应 的 纹理 坐标 
for(uint32 i = 6; i «< meshData.Vertices.size(); ++i) 


{ 




















// 投影 到 单位 球面 上 
XMVECTOR n = XMVector3Normalize(XMLoadFloat3(&meshData.Vertices[i]. 
Position)); 





// 投射 到 球面 上 
XMVECTOR p = radius*n; 


XMStoreFloat3(&meshData.Vertices[i].Position, p); 
XMStoreFloat3(&meshData.Vertices[i].Normal, n); 


























// 根据 球面 坐标 推导 出 纹理 坐标 
float theta = atan2f(meshData.Vertices[i].Position.z, 
meshData.Vertices[i].Position.x); 











// 将 theta 限 制 在 [6，2pi] 区 间 内 
if(theta < 6.6f) 
theta += XM 2PI; 


float phi = acosf(meshData.Vertices[i].Position.y / radius); 


meshData.Vertices[i].TexC.x = theta/XM 2PI; 
meshData.Vertices[i].TexC.y = phi/XM PI; 





// 求 出 P 关 于 theta (p 对 于 theta) 的 偏 导 数 
meshData.Vertices[i].TangentU.x = -radius*sinf(phi)*sinf(theta); 
meshData.Vertices[i].TangentU.y = 0.6f; 
meshData.Vertices[i].TangentU.z = +tradius*sinf(phi)*cosf(theta); 


XMVECTOR T = XMLoadFloat3(&meshData.Vertices[i].TangentU); 
XMStoreFloat3(&meshData.Vertices[i].TangentU, XMVector3Normalize(T)); 


} 


return meshData; 





7.5 ”绘制 多 种 几何 体 演 示 程 序 


为 了 示范 生成 球体 和 柱 体 的 代码 ， 我 们 实现 了 效果 如 图 7.6 所 示 的 
Shapes 演 示 程 序 。 男 外 ， 在 探 完 该 例 程 的 过 程 中 ， 我 们 将 获得 在 场景 中 
《利用 创建 多 个 世界 变换 矩阵 ) 绘制 多 个 物体 并 对 其 进行 定位 的 宝贵 经 
验 。 此 外 ， 我 们 会 将 场景 中 的 所 有 几何 体 都 置 于 一 个 大 的 顶点 缓冲 区 和 
一 个 索引 缓冲 区 中 。 最 后 ， 通 过 多 次 调用 DrawIndexedInstanced 方 法 
来 绘制 每 一 个 物体 《〈 即 每 次 调用 仅 绘 制 一 个 物体 ， 因 为 不 同 物体 的 世界 
矩阵 也 各 不 相同 ) 。 因 此 ， 我 们 将 看 到 一 个 涉及 修 
改 DrawIndexedInstanced 方 法 中 StartIndexLocation 和 
BaseVertexLocation 参 数 的 调用 示例 。 





DH d3d App fps: 60.000000 mspf: 16.666666 





图 7.6 ”Shapes 演 示 程 序 的 效果 


7.5.1 顶点 缓冲 区 和 索引 绥 冲 区 


正如 图 7.6 所 示 ， 在 Shapes 演 示 程 序 中 ， 我 们 要 绘制 长 方 体 、 顶 格 、 
柱 体 〈 圆 台 ) 及 球体 。 尽 管 在 示例 中 要 绘制 多 个 球体 和 柱 体 ， 但 实际 上 
我 们 只 需 对 一 组 球体 和 圆 台 数据 的 副本 。 通 过 利用 不 同 的 世界 窍 阵 ， 对 
这 组 数据 进行 多 次 绘制 ， 即 可 绘制 出 多 个 预定 的 球体 与 圆 台 。 所 以 说 ， 
这 也 是 一 个 几何 体 实 例 化 〈instancing) 的 范例 ， 借 助 此 技术 可 以 减少 内 
存 资源 的 占用 。 


通过 将 不 同 物体 的 顶点 和 索引 合并 起 来 ， 我 们 把 所 有 几何 体 网 格 的 
顶点 和 索引 都 装 进 一 个 顶点 缓冲 区 及 一 个 索引 绥 冲 区 内 。 这 意味 着， 在 
绘制 一 个 物体 时 ， 我 们 只 需 绘 制 此 物体 位 于 顶点 和 索引 这 两 种 缓冲 区 中 
的 数据 子 集 。 为 了 调 
用 ID3D12GraphicsCommandList::DrawIndexedInstanced 方 法 而 仅 
绘制 几何 体 的 子 集 ， 我 们 需要 掌握 3 种 数据 (可 参照 图 6.3 并 回顾 6.3 市 的 
相关 讨论 ) ， 它 们 分 别 是 : 待 绘 制 物体 在 合并 索引 绥 冲 区 中 的 起 始 索 
引 、 待 绘制 物体 的 索引 数量 ， 以 及 基准 顶点 地 址 一 一 即 竺 绘制 物体 第 一 
个 顶点 在 合并 顶点 缓冲 区 中 的 索引 。 经 回顾 可 知 ， 基 准 顶 点 地 址 是 一 个 
整数 值 ， 我 们 要 在 绘制 调用 过 程 中 、 获 取 顶 点 数据 之 前 ， 将 它 与 物体 的 
原 索引 值 依次 相 加 ， 以 此 获取 合并 顶点 缓冲 区 中 所 绘 物体 的 正确 顶点 子 
集 (参见 第 5 章 的 练习 2) 。 








下 列 代 码 展示 了 创建 几何 体 缓冲 区 、 绥 存 绘制 调用 所 需 参 数值 以 及 
绘制 物体 的 具体 过 程 。 


void ShapesApp::BuildShapeGeometry() 
{ 


GeometryGenerator geoGen; 
GeometryGenerator: :MeshData box = geoGen.CreateBox(1.5f，6.5f，1.5f，3); 
GeometryGenerator: :MeshData grid = geoGen.CreateGrid(20.6f，36.6f，66，14 
0); 
GeometryGenerator: :MeshData sphere = geoGen.CreateSphere(060.5f, 206, 20); 
GeometryGenerator: :MeshData cylinder = geoGen.CreateCylinder(6.5f， 
6.3f，3.6f，26，26); 


// 

// 将 所 有 的 几何 体 数据 都 合并 到 一 对 大 的 顶点 /索引 缓冲 区 ， 
// 以 此 来 定义 每 个 子 网 格 数据 在 缓冲 区 中 所 占 的 范围 

// 





























// 对 合并 顶点 缓冲 区 中 每 个 物体 的 顶点 偏 移 量 进行 缓存 

UINT boxVertexOoffset = ©; 

UINT gridVertexOoffset = (UINT)box.Vertices.size(); 

UINT sphereVertexOffset = gridVertexOffset + (UINT)grid.Vertices.sizel(); 

UINT cylinderVertexOffset = sphereVertexOffset + (UINT)sphere.Vertices.s 
ize( ) ; 





// 对 合并 索引 缓冲 区 中 每 个 物体 的 起 始 索引 进行 缓存 

UINT boxIndexOffset = 0; 

UINT gridIndexOoffset = (UINT)box.Indices32.size(); 

UINT sphereIndexOffset = gridIndexOffset + (UINT)grid.Indices32.sizel(); 
UINT cylinderIndexOffset = sphereIndexOffset + (UINT)sphere.Indices32.si 


ze(); 


// 定义 的 多 个 submeshGeometry 结 构 体 中 包含 了 顶点 /索引 缓冲 区 内 不 同 几何 体 的 子 网 格 
数据 

















SubmeshGeometry boxSubmesh; 

boxSubmesh.IndexCount = (UINT)box.Indices32.size(); 
boxSubmesh .StartIndexLocation = boxIndexOoffset; 
boxSubmesh.BaseVertexLocation = boxVertexOoffset; 


SubmeshGeometry gridSubmesh ; 

gridSubmesh.IndexCount = (UINT)grid.Indices32.size(); 
gridsubmesh.StartIndexLocation = gridIndexOffset ; 
gridSubmesh.BaseVertexLocation = gridVertexOffset ; 


SubmeshGeometry sphereSubmesh; 

sphereSubmesh.IndexCount = (UINT)sphere.Indices32.size(); 
sphereSubmesh.StartIndexLocation = sphereIndexOffset ; 
sphereSubmesh.BaseVertexLocation = sphereVertexOoffset; 


SubmeshGeometry cylinderSubmesh; 
cylinderSubmesh.IndexCount = (UINT)cylinder.Indices32.sizel(); 
cylinderSubmesh.StartIndexLocation = CylinderIndexOffset ; 


cylinderSubmesh.BaseVertexLocation = CylinderVertexOffset ; 








// 
// 提取 出 所 需 的 顶点 元 素 ， 再 将 所 有 网 格 的 顶点 装 进 一 个 顶点 缓冲 区 
// 





auto totalVertexCount = 
box.Vertices.size() + 
grid.Vertices.size() + 
sphere.Vertices.size() + 
cylinder.Vertices.sizel(); 


std: :vector<Vertex> vertices(totalVertexCount); 


UINT k = @; 

for(size t i = 6; i «< box.Vertices.size(); ++i, ++k) 

{ 
vertices[k].Pos = box.Vertices[i].Position; 
vertices[k].Color = XMFLOAT4(DirectX::Colors::DarkGreen); 


} 


for(size t i = 8; i «< grid.Vertices.size(); ++i, ++k) 
{ 
vertices[k].Pos = grid.Vertices[i].Position; 
vertices[k].Color = XMFLOAT4(DirectX::Colors::ForestGreen); 
} 


for(size t i = 6;j i «< sphere.Vertices.size(); ++i, ++k) 

{ 
vertices[k].Pos = sphere.Vertices[i].Position; 
vertices[k].Color = XMFLOAT4(DirectX::Colors::Crimson); 


} 


for(size t i = 8; i < cylinder.Vertices.size(); ++i, ++k) 

{ 
vertices[k].Pos = cylinder.Vertices[i].Position; 
vertices[k].Color = XMFLOAT4(DirectX::Colors::SteelBlue); 


} 


std: :vector<std::uint16 t> indices; 
indices.insert(indices.end()， 
std: :begin(box.GetIndices16() )， 
std: :end(box.GetIndices16())); 
indices.insert(indices.end()， 
std: :begin(grid.GetIndices16() )， 
std: :end(grid.GetIndices16())); 
indices.insert(indices.end()， 


std: :begin(sphere.GetIndices16() )， 

std: :end(sphere.GetIndices16())); 
indices.insert(indices.end()， 

std: :begin(cylinder.GetIndices16() )， 

std: :end(cylinder.GetIndices16())); 


const UINT vbByteSize 
const UINT ibByteSize 


(UINT)vertices.size() * sizeof(Vertex); 
(UINT)indices.size() * sizeof(std::uint16 t); 


auto geo = std::make unique<MeshGeometry>(); 
geo->Name = "shapeGeo"; 


ThrowIfFailed(D3DCreateBlob(vbByteSize, &geo->VertexBufferCPU)); 
CopyMemory (geo->VertexBufferCPU->GetBufferpointer(), vertices.datal(), 
vbByteSize); 


ThrowIfFailed(D3DCreateBlob(ibByteSize, &geo->IndexBufferCPU)); 
CopyMemory (geo->IndexBufferCPU->GetBufferpointer(), indices.data(), 
ibByteSize); 


geo->VertexBufferGPU = d3dUtil::CreateDefaultBuffer(md3dDevice.Get(), 
mCommandList.Get(), vertices.data(), vbByteSize, geo- 
>VertexBufferUploader); 


geo->IndexBufferGPU = d3dUtil::CreateDefaultBuffer(md3dDevice.Get(), 
mCommandList.Get(), indices.data(), ibByteSize, geo- 
>IndexBufferUploader); 


geo->VertexByteStride = sizeof(Vertex); 
geo->VertexBufferByteSize = vbByteSize; 
geo->IndexFormat = DXGI FORMAT_ R16_UINT; 
geo->IndexBufferByteSize = ibByteSize; 


geo->DrawArgs["box"] = boxSubmesh ; 
geo->DrawArgs["grid"] = gridSubmesh; 
geo->DrawArgs["sphere"] = sphereSubmesh 
geo->DrawArgs["cylinder"] = cylinderSubmesh; 


mGeometries[geo->Name] = std::move(geo); 





上 述 方法 中 最 后 一 行 所 用 到 的 变量 mGeometries 被 定义 为 : 


std: :unordered map<std::string, std::unique ptr<MeshGeometry>> mGeometries; 





这 是 我 们 在 本 书后 面 常会 用 到 的 一 种 通用 模式 : 为 每 个 几何 体 、 
PSO、 纹 理 和 着 色 器 等 创建 新 的 变量 名 是 一 件 很 烦人 的 事 ， 所 以 我 们 使 
用 无 序 映 射 表 (unordered map) ， 并 根据 名 称 在 常数 时 间 (constant 
time) 内 寻找 和 引用 所 需 的 对 象 。 以 下 是 一 些 相 关 的 范例 : 





std: :unordered map<std::string, std::unique ptr<MeshGeometry>> mGeometries 


3 
std: :unordered map<std::string, Comptr<ID3DBlob>> mShaders; 
std: :unordered map<std::string, Comptr<ID3D12PipelineState>> mPSOs ; 








现在 我 们 来 定义 场景 中 的 泻 染 项 。 通 过 观察 以 下 代码 可 知 ， 所 有 的 
染 项 共用 同一 个 MeshGeometry， 所 以 ， 我 们 通过 DrawArgs 获 取 
DrawIndexedInstanced 方 法 的 参数 ， 并 以 此 来 绘制 项 点 /索引 缓冲 区 

的 子 区 域 〈 也 就 是 单个 几何 体 ) 。 





// ShapesApp 类 中 的 成 员 变 量 
std: :Vector<std: :unique_ptr<RenderItem>> mAllRitems; 
std: :Vector<RenderItemk> mOpaqueRitems; 





void ShapesApp::BuildRenderItems() 
{ 
auto boxRitem = std::make unique<RenderItem>(); 
XMStoreFloat4x4(&boxRitem- >World, 
XMMatrixScaling(2.6f, 2.6f, 2.6f)*XMMatrixTranslation(68.6f, 6.5f, 8.6f 
)); 
boxRitem->0bjCBIndex = 6 
boxRitem->Geo = mGeometries["shapeGeo"].get(); 
boxRitem->PrimitiveType = D3D_PRIMITIVE_TOPOLOGY_TRIANGLELIST ; 
boxRitem->IndexCount = boxRitem->Geo->DrawArgs["box"].IndexCount; 
boxRitem->StartIndexLocation = boxRitem->Geo->DrawArgs["box"]. 
StartIndexLocation; 
boxRitem->BaseVertexLocation = boxRitem->Geo->DrawArgs["box"]. 
BaseVertexLocation; 


mAllRitems.push back(std: :move(boxRitem) ) ; 


auto gridRitem = std::make unique<RenderItem>(); 

gridRitem->World = MathHelper::Identity4x4(); 
gridRitem->O0bjCBIndex = 1; 

gridRitem->Geo = mGeometries["shapeGeo"].get(); 
gridRitem->PrimitiveType = D3D_PRIMITIVE TOPOLOGY _ TRIANGLELIST; 
gridRitem->IndexCount = gridRitem->Geo->DrawArgs["grid"].IndexCount; 

gridRitem->StartIndexLocation = gridRitem->Geo->DrawArgs["grid"]. 
StartIindexLocation; 

gridRitem->BaseVertexLocation = gridRitem->Geo->DrawArgs["grid"]. 
BaseVertexLocation; 

mAllRitems.push back(std: :move(gridRitem)); 


// 构建 图 7.6 所 示 的 柱 体 和 球体 

UINT objCBIndex = 2; 

for(int i = 6j i < 5; ++i) 

{ 
auto leftCylRitem = std::make unique<RenderItem>(); 
auto rightCylRitem = std::make unique<RenderItem>(); 
auto leftSphereRitem = std::make unique<RenderItem>(); 
auto rightSphereRitem = std::make unique<RenderItem>(); 


XMMATRIX leftCylWorld = XMMatrixTranslation(-5.6f, 1.5f, -10.6f + i*5. 
6f ) ; 

XMMATRIX rightCylWorld = XMMatrixTranslation(+5.6f, 1.5f, -10.6f + i*5 
.Of) ; 


XMMATRIX leftSphereWorld = XMMatrixTranslation(-5.6f, 3.5f, -16.6f + i 
*5 .Of); 

XMMATRIX rightSphereWorld = XMMatrixTranslation(+5.6f, 3.5f, -160.6f + 
i*5 .0@f); 


XMStoreFloat4x4(&leftCylRitem->World, rightCylWorld); 

leftCylRitem->0bjCBIndex = objCBIndex++; 

leftCylRitem->Geo = mGeometries["shapeGeo"].get(); 

leftCylRitem->PrimitiveType = D3D_ PRIMITIVE TOPOLOGY_ TRIANGLELIST; 

leftCylRitem->IndexCount = leftCylRitem->Geo->DrawArgs["cylinder"]. 
IndexCount; 

leftCylRitem->StartIndexLocation = 
leftCylRitem->Geo->DrawArgs["cylinder"].StartIndexLocation; 

leftCylRitem->BaseVertexLocation = 
leftCylRitem->Geo->DrawArgs["cylinder"].BaseVertexLocation; 


XMStoreFloat4x4(&rightCylRitem->World, leftCylWorld); 
rightCylRitem->O0bjCBIndex = objCBIndex++; 

rightCylRitem->Geo = mGeometries["shapeGeo"].get(); 
rightCylRitem->PrimitiveType = D3D_PRIMITIVE TOPOLOGY TRIANGLELIST; 


rightCylRitem->IndexCount = rightCylRitem->Geo->DrawArgs["cylinder"]. 
IndexCount; 

rightCylRitem->StartIndexLocation = 
rightCylRitem->Geo->DrawArgs["cylinder"].StartIindexLocation; 

rightCylRitem->BaseVertexLocation = 
rightCylRitem->Geo->DrawArgs["cylinder"].BaseVertexLocation; 


XMStoreFloat4x4(&leftSphereRitem->World, leftSphereWorld); 
leftSphereRitem->0bjCBIndex = objCBIndex++; 

leftSphereRitem->Geo = mGeometries["shapeGeo"|.get(); 
leftSphereRitem->PrimitiveType = D3D_ PRIMITIVE TOPOLOGY _ TRIANGLELIST; 
leftSphereRitem->IndexCount = leftSphereRitem->Geo->DrawArgs["sphere"] 


IndexCount; 
leftSphereRitem->StartIndexLocation = 
leftSphereRitem->Geo->DrawArgs["sphere"].StartIindexLocation; 
leftSphereRitem->BaseVertexLocation = 
leftSphereRitem->Geo->DrawArgs["sphere"].BaseVertexLocation; 


XMStoreFloat4x4(&rightSphereRitem->World, rightSphereWorl1d); 
rightSphereRitem->O0bjCBIndex = objCBIndex++; 

rightSphereRitem->Geo = mGeometries["shapeGeo"|.get(); 
rightSphereRitem->PrimitiveType = D3D PRIMITIVE TOPOLOGY_ TRIANGLELIST:; 
rightSphereRitem->IndexCount = rightSphereRitem->Geo->DrawArgs["sphere 


IndexCount; 
rightSphereRitem->StartIndexLocation = 
rightSphereRitem->Geo->DrawArgs["sphere"].StartIindexLocation; 
rightSphereRitem->BaseVertexLocation = 
rightSphereRitem->Geo->DrawArgs["sphere"].BaseVertexLocation; 


mAllRitems.push back(std::move(leftCylRitem)); 
mAllRitems.push back(std::move(rightCylRitem)); 
mAllRitems.push back(std::move(leftSphereRitem)); 
mAllRitems.push_ back(std::move(rightSphereRitem)); 


} 
// 此 演示 程序 中 的 所 有 泻 染 项 都 是 非 透 明 的 























for(auto& e : mAllRitems) 
mOpaqueRitems.push back(e.get()); 





回顾 前 文 可 知 ， 我 们 已 经 创建 了 一 个 由 FrameResource 类 型 元 素 所 
构成 的 向量 ， 每 个 FrameResource 中 都 有 上 传 缓冲 区 ， 用 于 为 场景 中 的 
每 个 演 染 项 存储 泻 染 过 程 常量 以 及 物体 常量 数据 。 








std: :unique ptr<UploadBuffer<PassConstants>> PassCB = nullptr; 





std: :unique ptr<UploadBuffer<ObjectConstants>> ObjectCB = nullptr; 





如 果 有 3 个 帧 资源 与 n 个 泻 染 项 ， 那 么 就 应 存在 3n 个 物体 常量 缓冲 区 
(object constant buffer) 以 及 3 个 演 染 过 程 常 量 缓冲 区 (pass constant 
buffer) 。 因 此 ， 我 们 也 就 需要 创建 3tn 二 1 个 常量 绥 冲 区 视图 
(CBV) 。 这 样 一 来 ， 我 们 还 要 修改 CBV 堆 以 容纳 额外 的 描述 符 : 





void ShapesApp::BuildDescriptorHeaps() 


{ 
UINT objCount = (UINT)mOpaqueRitems.sizel(); 





// 我 们 需要 为 每 个 帧 资源 中 的 每 一 个 物体 都 创建 一 个 CBV 描 述 符 ， 
// 为 了 容纳 每 个 帧 资源 中 的 泻 染 过 程 CBV 而 +1 


UINT numDescriptors = (objCount+1) * gNumFrameResources; 























// 保存 泻 染 过 程 CBV 的 起 始 偏 移 量 。 在 本 程序 中 ， 这 是 排 在 最 后 面 的 3 个 描述 符 





mPassCbvoffset = objCount * gNumFrameResources; 


D3D12_DESCRIPTOR HEAP_DESC cbvHeapDesc; 

cbvHeapDesc .NumDescriptors = numDescriptors; 

cbvHeapDesc.Type = D3D12 DESCRIPTOR HEAP_TYPE_CBV_SRV_UAYV; 

cbvHeapDesc.Flags = D3D12 DESCRIPTOR HEAP_ FLAG SHADER VISIBLE; 

cbvHeapDesc.NodeMask = 6; 

ThrowIfFailed(md3dDevice->CreateDescriptorHeap(&cbvHeapDesc， 
IID_PPV_ARGS(&mCbvHeap ) ) ) ; 





现在 ， 我 们 就 可 以 用 下 列 代 码 来 填充 CBV 堆 ， 其 中 描述 符 0 至 描述 
符 " 一 ] 包 含 了 第 0 个 帧 资源 的 物体 CBV， 四 符 n 至 描述 符 27 一 1] 容纳 了 第 
1 个 帧 资源 的 物体 CBV， 以 此 类 推 ， 描 述 符 27 至 描述 符 37 一 ] 包 含 了 第 2 个 


帧 资源 的 物体 CBV。 最 后 ，3n、3n + 1 以 及 3n + 2 分 别 存 有 第 0 个 、 第 1 个 
和 第 2 个 帧 资源 的 泻 染 过 程 CBV: 





void ShapesApp::BuildConstantBufferViews() 


{ 
UINT objCBByteSize = d3dUtil::CalcConstantBufferByteSize(sizeof 


(ObjectConstants)); 


UINT objCount = (UINT)mOpaqueRitems.sizel(); 





// 每 个 帧 资源 中 的 每 一 个 物体 都 需要 一 个 对 应 的 CBV 描 述 符 
for(int frameIndex = 6; frameIndex < gNumFrameResources; ++frameIndex) 


{ 

















auto objectCB = mFrameResources[frameIndex]->ObJjectCB->Resource() ; 
for(UINT i = 6; i «< objCount; ++i) 
{ 
D3D12_GPU_VIRTUAL ADDRESS cbAddress = objectCB->GetGPUVirtualAddress 
(); 


// 偏 移 到 缓冲 区 中 第 i 个 物体 的 常量 缓冲 区 
cbAddress += i*objCBByteSize; 


// 偏 移 到 该 物体 在 描述 符 堆 中 的 CBV 

int heapIndex = frameIndex*objCount + i; 

auto handle = CD3DX12 CPU_DESCRIPTOR HANDLE( 
mCbvHeap->GetCPUDescriptorHandleForHeapStart()); 

handle.Ooffset(heapIndex, mCbvSrvUavDescriptorSize); 








D3D12 CONSTANT BUFFER VIEW DESC cbvDesc; 
cbvDesc.BufferLocation = cbAddress; 
cbvDesc.SizeInBytes = objCBByteSize; 


md3dDevice->CreateConstantBufferView(&cbvDesc, handle); 


} 
} 


UINT passCBByteSize = d3dUtil::CalcConstantBufferByteSize(sizeof 
(PassConstants)); 


// 最 后 3 个 描述 符 依次 是 每 个 帧 资源 的 泻 染 过 程 CBV 
for(int frameIndex = 6; frameIndex < gNumFrameResources; ++frameIndex) 


{ 





auto passCB = mFrameResources[frameIndex]->PassCB->Resource(); 











// 每 个 帧 资源 的 泻 染 过 程 缓冲 区 中 只 存 有 一 个 常量 绥 冲 区 




















D3D12_GPU_VIRTUAL_ADDRESS cbAddress = passCB->GetGPUVirtualAddress(); 








// 偏 移 到 描述 符 堆 中 对 应 的 泻 染 过 程 CBV 

int heapIndex = mPassCbvoffset + frameIndex; 

auto handle = CD3DX12_CPU_DESCRIPTOR_HANDLE( 
mCbvHeap->GetCPUDescriptorHandleForHeapStart()); 

handle.offset(heapIndex, mCbvSrvUavDescriptorSize); 





D3D12 CONSTANT_ BUFFER VIEW DESC cbvDesc ; 
cbvDesc.BufferLocation = cbAddress ; 
cbvDesc.SizeInBytes = passCBByteSize; 


md3dDevice->CreateConstantBufferView(&cbvDesc, handle); 





前 文 已 经 讲 过 ， 通 过 调 

用 ID3D12DescriptorHeap::GetCPUDescriptorHandleForHeapStar 
方法 ， 我 们 可 以 获得 堆 中 第 一 个 描述 符 的 句柄 。 然 而 ， 我 们 当前 堆 内 所 
存放 的 描述 符 已 不 止 一 个 ， 所 以 仅 使 用 此 方法 并 不 能 找到 其 他 描述 符 的 
句柄 。 此 时 ， 我 们 希望 能 够 偏 移 到 堆 内 的 其 他 描述 符 处 ， 为 此 需要 了 解 
到 达 堆 内 下 一 个 相 邻 描述 符 的 增 量 。 这 个 增 量 的 大 小 其 实 是 由 硬件 来 确 
定 的 ， 所 以 我 们 必须 从 设备 上 和 碍 询 相关 的 信息 。 此 外 ， 该 增 量 还 依赖 于 
堆 的 具体 类 型 。 现 在 来 重 温 在 D3DApp 类 中 缓存 的 下 列 信息 : 


mRtvDescriptorSize = md3dDevice->GetDescriptorHandleIncrementSize( 
D3D12_ DESCRIPTOR HEAP_TYPE_RTV); 


mDsvDescriptorSize = md3dDevice->GetDescriptorHandleIncrementSize( 
D3D12_ DESCRIPTOR HEAP_TYPE_DSV); 


mCbvSrvUavDescriptorSize = md3dDevice->GetDescriptorHandleIncrementSize( 
D3D12_DESCRIPTOR_HEAP_TYPE_CBV_SRV_UAV) ; 





只 要 知道 了 相 邻 描述 符 之 间 的 增 量 大 小 ， 就 能 通过 两 种 
CD3DX12_CPU_DESCRIPTOR_HANDLE: : 0ffset 方 法 之 一 偏 移 到 第 n 个 


描述 符 的 句柄 处 : 





// 指定 要 仿 移 到 的 目标 描述 符 的 编号 ， 将 它 与 相 邻 描述 符 之 间 的 增 量 相 乘 ， 以 此 来 找到 第 n 
个 描述 符 的 句柄 

CD3DX12_CPU_DESCRIPTOR_HANDLE handle = mCbvHeap->GetCPUDescriptorHandleFor 
HeapStart(); 

handle.offset(n * mCbvSrvDescriptorSize); 
































// 或 者 用 另 一 个 等 价 实现 ， 先 指定 要 偏 移 到 第 几 个 描述 符 ， 再 给 出 描述 符 的 增 量 大 小 
CD3DX12 CPU_ DESCRIPTOR HANDLE handle = mCbvHeap->GetCPUDescriptorHandleFor 
HeapStart(); 

handle.offset(n, mCbvSrvDescriptorSize); 





























CD3DX12_GPU_DESCRIPTOR_HANDLE 有 着 同样 的 0ffset 方 法 。 


7.5.4 ”绘制 场景 




















void ShapesApp::DrawRenderItems( 
ID3D12GraphicsCommandList* cmdList， 
const std::vector<RenderItem*>& ritems) 
{ 
UINT objCBByteSize = d3dUtil::CalcConstantBufferByteSize(sizeof( 
ObjectConstants) ) ; 
auto objectCB = mCurrFrameResource->0bjectCB->Resource(); 


// 对 于 每 个 演 染 项 来 说 ... 
for(size t i = 6; i «< ritems.size(); ++i) 
{ 


auto ri = ritems[i]; 





cmdList->IASetVertexBuffers(60, 1, &ri->Geo->VertexBufferView!()); 
cmdList->IASetIndexBuffer(&ri->Geo->IndexBufferView()); 
cmdList->IASetPrimitiveTopology(ri->primitiveType); 





// 为 了 绘制 当前 的 帧 资源 和 当前 物体 ， 偶 移 到 描述 符 堆 中 对 应 的 CBV 处 

UINT cbvIndex = mCurrFrameResourceIndex*(UINT)mOpaqueRitems.size() 
+ ri->0bjCBIndex; 

auto cbvHandle = CD3DX12 GPU_DESCRIPTOR_HANDLE( 
mCbvHeap->GetGPUDescriptorHandleForHeapStart()); 

cbvHandle.Ooffset(cbvIindex, mCbvSrvUavDescriptorSize); 











cmdList->SetGraphicsRootDescriptorTable(6, cbvHandle); 
cmdList->DrawIndexedInstanced(ri->IndexCount, 1,， 
ri->StartIndexLocation, ri->BaseVertexLocation, 0); 





在 执行 主要 绘制 函数 Draw 的 过 程 中 调用 DrawRenderItems 方 法 : 





void ShapesApp::Draw(const GameTimer& gt ) 
{ 


auto cmdListAlloc = mCurrFrameResource->CmdListAlloc; 





// 复 用 与 记录 命令 有 关 的 内 存 
// 只 有 在 GPU 执行 完 与 该 内 存 相 关联 的 命令 列表 时 ， 才 能 对 此 命令 列表 分 配器 进行 重 置 
ThrowIfFailed(cmdListAlloc->Reset()); 






































// 在 通过 ExecuteCommandList 方 法 将 命令 列表 添加 到 命令 队列 中 之 后 ， 我 们 就 可 以 对 它 
进行 重 置 
// 复 用 命令 列表 即 复 用 与 之 相关 的 内 存 
if(mIsWireframe) 
{ 
ThrowIfFailed(mCommandList->Reset( 
cmdListAlloc.Get(), mpSOs["opaque wireframe"].Get())); 


























} 


else 

{ 
ThrowIfFailed(mCommandList->Reset(cmdListAlloc.Get(), 
mpSOs["opaque"].Get())); 


} 


mCommandList->RSSetViewports(1, &mScreenViewport); 
mCommandList->RSSetScissorRects(1, &mScissorRect); 


// 根据 资源 的 用 途 指示 资源 状态 的 转换 
mCommandList->ResourceBarrier(1, 
&CD3DX12 RESOURCE BARRIER: :Transition(CurrentBackBuffer(), 
D3D12 RESOURCE STATE_ PRESENT, 
D3D12 RESOURCE STATE RENDER TARGET)); 





// 清除 后 台 组 冲 区 和 深度 缓冲 区 
mCommandList->ClearRenderTargetView(CurrentBackBufferView()， 
Colors::LightSsteelBlue，6，nullptr); 
mCommandList->ClearDepthstencilView(DepthStencilView()， 
D3D12 CLEAR FLAG DEPTH | D3D12 CLEAR FLAG STENCIL, 
1.6f, 0, 0, nullptr); 





























// 指定 要 泻 染 的 目标 缓冲 区 
mCommandList->OMSetRenderTargets(1，&CurrentBackBufferView()， 
true, &DepthStencilView()); 


ID3D12DescriptorHeap* descriptorHeaps[] = { mCbvHeap.Get() }; 
mCommandList->SetDescriptorHeaps(_countof(descriptorHeaps), descriptorHe 


aps); 
mCommandList->SetGraphicsRootSignature(mRootSignature.Get()); 


int passCbvIndex = mPassCbvoffset + mCurrFrameResourceIndex; 
auto passCbvHandle = CD3DX12 GPU DESCRIPTOR HANDLE( 
mCbvHeap->GetGPUDescriptorHandleForHeapStart()); 
passCbvHandle.O0ffset(passCbvIindex, mCbvSrvUavDescriptorSize); 
mCommandList->SetGraphicsRootDescriptorTable(1, passCbvHandle); 


DrawRenderItems(mCommandList.Get(), mOpaqueRitems); 


// 按照 资源 的 用 途 指示 资源 状态 的 转换 
mCommandList->ResourceBarrier(1, 
&CD3DX12 RESOURCE BARRIER: :Transition(CurrentBackBuffer( ) ， 
D3D12 RESOURCE_ STATE RENDER_TARGET, 
D3D12 RESOURCE STATE_ PRESENT)); 


// 完成 命令 的 记录 
ThrowIfFailed(mCommandList->Close()); 


// 将 命令 列表 加 入 到 命令 队列 中 用 于 执行 
ID3D12CommandList* cmdsLists[] = { mCommandList.Get() }; 
mCommandQueue->ExecuteCommandLists( countof(cmdsLists), cmdsLists); 








// 交换 前 后 台 绥 冲 区 
ThrowIfFailed(mSwapChain->Present(6, 0)); 
mCurrBackBuffer = (mCurrBackBuffer + 1) % SwapChainBufferCount; 

















// 增加 围栏 值 ， 将 之 前 的 命令 标记 到 此 围栏 点 上 


mCurrFrameResource->Fence = ++mCurrentFence ; 




















// 向 命令 队列 添加 一 条 指令 ， 以 设置 新 的 围栏 点 
// GPU 还 在 执行 我 们 此 前 向 命令 队列 中 传 入 的 命令 ， 所 以 ，GPU 不 会 立即 设置 新 






































// 的 围栏 点 ， 这 要 等 到 它 处 理 完 Signal() 函 数 之 前 的 所 有 命令 
mCommandQueue->Signal(mFence.Get(), mCurrentFence); 











7.6” 细 探 根 签名 


我 们 在 6.6.5 节 中 曾 介 绍 过 根 签名 。 根 签名 定义 了 : 在 绘制 调用 之 
前 ， 需 要 绑 定 到 演 染 流水 线 上 的 资源 ， 以 及 这 些 资源 应 如 何 映 冉 到 看 色 
右 的 输入 寄存 器 中 。 选 择 绑 定 到 流水 线 上 的 资源 要 根据 着 色 器 程序 的 具 
体 需 求 。 从 PSO 被 创建 之 时 起 ， 根 签名 和 着 色 需 程序 的 组 合 就 开始 生 
效 。 


7.6.1 根 参 数 


回顾 根 签名 的 相关 知识 可 知 ， 根 签名 是 由 一 系列 根 参数 定义 而 成 。 
到 目前 为 止 ， 我们 只 创建 过 存 有 一 个 描述 符 表 的 根 参 数 。 然 而 ， 根 参数 
其 实 有 3 个 类 型 可 选 。 


1. 摘 述 答 表 (descriptor table) : 摘 述 符 表 引用 的 是 描述 符 扒 中 的 
一 块 连续 范围 ， 用 于 确定 要 绑 定 的 资源 。 


2. 根 擅 述 符 (root descriptor， 叉 称 为 内 联 描述 符 ，inline 
descriptor) : 通过 直接 设置 根 擅 述 符 即 可 指示 要 绑 定 的 资源 ， 而 且 无 需 
将 它 存 于 描述 符 推 中。 但是， 只 有 常量 缓冲 区 的 CBV， 以 及 缓冲 区 的 
SRV/UAV 着色 器 资源 视图 /无 序 访问 视图 ) 才 可 以 根 扩 述 符 的 号 份 进 
行 绑 定 。 这 也 就 意味 着 纹理 的 SRV 并 不 能 作为 根 搞 述 符 来 实现 资源 绑 
定 。 














3. 根 第 量 (root constant) : 借助 根 常量 可 直接 绑 定 一 系列 32 位 的 
常量 值 。 


考虑 到 性 能 因素 ， 可 放 入 一 个 根 签名 的 数据 以 64 DWORD 为 限 。3 
种 根 参数 类 型 占用 空间 的 情况 如 下 。 


1. 描述 符 表 : 每 个 描述 符 表 品 用 1 DWORD。 


2. 根 擅 述 符 : 每 个 根 描 述 符 〈64 位 的 GPU 虚拟 地 址 ) 占用 2 








3. 根 常量 : 每 个 常量 32 位 ， 占 用 1DWORD。 


我 们 可 以 创建 出 任意 组 合 的 根 签名 ， 只 要 它 不 超过 64 DWORD 的 上 
限 即 可 。 根 常量 虽然 用 起 来 方便 ， 但 是 它 的 空间 消耗 增加 迅速 。 例 如 ， 
倘 知 所 用 的 “世界 一 视图 一 投影 ” 算 阵 只 有 和 负 量 数据 ， 那 么 ， 我 们 惑 能 
16 个 根 常 量 来 存储 它 ， 还 无 需 再 创建 相应 的 常量 缓冲 区 以 及 CBV 堆 。 然 
而 ， 这 些 根 利 量 却 “ 吃 掉 ” 了 我 们 根 签名 预算 的 1M4。 使 用 1 个 根 擅 述 符 只 
占 2 DWORD， 而 1 个 描述 符 表 仅 用 1 DWORD。 由 于 我 们 的 应 用 程序 会 
变 得 愈加 复 架 ， 其 常量 缓冲 区 中 的 数据 也 将 越 来 越 上 庞大 ， 因 而 也 不 太 可 
能 仅 使 用 根 常量 。 所 以 ， 在 现实 的 应 用 程序 中 ， 我 们 很 可 能 会 经 常 混用 
这 3 种 根 参 数 。 




















在 代码 中 要 通过 填写 CD3DX12_ROOT_PARAMETER 结 构 体 来 描述 根 参 
数 。 就 像 我 们 之 前 兽 见 到 过 的 以 CD3DX 作 为 前 组 的 其 他 辅助 结构 体 一 
样 ，CD3DX12_ROOT_PARAMETER 是 对 结构 体 D3D12_ROOT_PARAMETER 进 


行 扩 展 ， 并 增加 一 些 辅 助 初始 化 函数 而 得 来 的 加。 


typedef struct D3D12_ROOT_PARAMETER 


D3D12 ROOT_ PARAMETER TYPE ParameterType; 

union 

{ 
D3D12_ ROOT_DESCRIPTOR_ TABLE DescriptorTable; 
D3D12_ ROOT_CONSTANTS Constants ; 
D3D12_ROOT_DESCRIPTOR Descriptor; 

}; 

D3D12_SHADER_ VISIBILITY ShaderVisibility; 

}D3D12 ROOT_PARAMETER; 





1. ParameterType: 下 列 枚 举 类 型 的 成 员 之 一 ， 用 于 指示 根 参 数 
的 类 型 〈 摘 述 符 表 、 根 常量 、CBV 根 擅 述 符 、SRV 根 擅 述 符 、UAV 根 搞 


I 


述 符 ) 。 


enum D3D12_ROOT_PARAMETER_TYPE 

{ 
D3D12_ ROOT_PARAMETER_TYPE_DESCRIPTOR_TABLE 
D3D12_ROOT_PARAMETER_TYPE_32BIT_CONSTANTS 


D3D12_ROOT_PARAMETER_TYPE_CBV 

D3D12_ROOT_PARAMETER_TYPE_SRV 

D3D12_ROOT_PARAMETER_TYPE_UAV 
} D3D12_ROOT_PARAMETER_TYPE; 





2. DescriptorTable/Constants/Descriptor: 描述 根 参数 的 
结构 体 。 访 联合 体 成 员 的 填写 依 根 签名 的 具体 类 型 而 定 。 我 们 会 在 7.6.2 
节 、7.6.3 节 和 7.6.4 节 中 对 此 结构 体 展开 讨论 。 





3. ShaderVisibility: 下 列 枚 举 类 型 的 成 员 之 一 ， 指 定 此 根 参 
数 在 着 色 器 程序 中 的 可 见 性 。 本 书 中 一 般 会 采 
用 D3D12_SHADER_VISIBILITY_ALL 枚 举 项 。 举 个 例子 : 如 果 知 道 某 种 


资源 只 会 在 像素 着 色 器 中 使 用 ， 我 们 就 可 把 此 资源 的 这 一 项 指定 
为 D3D12_SHADER_VISIBILITY_PIXEL。 限 制 根 参数 的 可 见 性 可 能 使 程 
序 的 性 能 得 到 优化 。 


enum D3D12_SHADER_VISIBILITY 

{ 
D3D12_SHADER_VISIBILITY ALL 
D3D12_SHADER_VISIBILITY_VERTEX 


D3D12_SHADER_VISIBILITY_HULL 
D3D12_SHADER_VISIBILITY_DOMAIN 
D3D12_SHADER_VISIBILITY_GEOMETRY 
D3D12_SHADER_VISIBILITY_PIXEL 

} D3D12 SHADER VISIBILITY; 





7.6.2 ”描述 符 表 


通过 填写 D3D12_ROOT_PARAMETER 结 构 体 的 成 
员 DescriptorTable， 即 可 进一步 将 根 参 数 的 类 型 定义 为 描述 符 表 


(descriptor table) 。 


typedef struct D3D12_ROOT_DESCRIPTOR_TABLE 


UINT NumDescriptorRanges 
const D3D12_DESCRIPTOR_RANGE *pDescriptorRanges; 
} D3D12 ROOT_DESCRIPTOR_ TABLE; 





凭借 上 述 结构 体 可 以 方便 地 指定 一 个 D3D12_DESCRIPTOR_RANGE 类 
型 数组 ， 以 及 该 数组 中 元 素 的 数量 。 


结构 体 D3D12_DESCRIPTOR_RANGE 的 定义 如 下 : 


typedef struct D3D12 DESCRIPTOR_ RANGE 
{ 


D3D12_DESCRIPTOR_RANGE_TYPE RangeType; 

UINT NumDescriptors; 

UINT BaseShaderRegister; 

UINT RegisterSpace; 

UINT OffsetInDescriptorsFromTableStart; 
} D3D12 DESCRIPTOR RANGE; 





1. RangeType: 下 列 枚 举 类 型 的 成 员 之 一 ， 指 示 此 范围 (range) 
中 的 描述 符 类 型 : 


enum D3D12_DESCRIPTOR_RANGE_TYPE 


{ 
D3D12_DESCRIPTOR_RANGE_TYPE_SRV 


D3D12_DESCRIPTOR_RANGE_TYPE_UAV 
D3D12_DESCRIPTOR RANGE TYPE_CBV 
D3D12_ DESCRIPTOR RANGE TYPE SAMPLER = 3 

} D3D12 DESCRIPTOR RANGE_TYPE; 





采样 器 描述 符 〈sampler descriptor) 将 在 与 纹理 贴图 有 关 的 章节 里 
进行 启 论 ， 


2. NumDescriptors: 范围 内 描述 符 的 数量 。 


3. BaseShaderRegister: 此 描述 符 范围 将 要 绑 定 到 的 基准 着 色 
器 寄存 器 (base shader register) 。 比 方 说 ， 如 果 您 将 NumDescriptors 
设 为 3， 把 BaseShaderRegister 置 为 1， 又 令 描述 符 范 围 的 类 型 为 常量 
缓冲 区 CBV， 那 么 ， 这 些 资源 将 按 以 下 方式 与 HLSL 寄 存 器 相 绑 定 。 





cbuffer cbA : register(b1) {...}; 


cbuffer cbB : register(b2) {...}; 
cbuffer cbC : register(b3) {...}; 





4. RegisterSpace: 此 属性 将 使 您 能 够 在 不 同 的 寄存 器 空间 中 指 
定 着 色 器 寄存 器 。 例 如 ， 下 列 代 码 中 的 两 种 资源 看 起 来 似乎 重复 使 用 了 
寄存 器 槽 tb， 但 实际 上 却 并 非 如 此 ， 因 为 它们 各 自 存在 于 不 同 的 空间 之 
中 : 











Texture2D gDiffuseMap : register(t0, space®); 
Texture2D gNormalMap : register(t0, spacel); 


如 果 在 着 色 器 中 没有 显 式 地 指定 空间 寄存 器 ， 那 么 它 将 自动 默认 为 
space0。 一 般 情 况 下 我 们 通常 使 用 space0， 但 是 对 于 资源 数组 来 说 ， 使 
用 多 重 寄 存 器 空间 会 更 加 方便 ， 尤 其 是 在 数组 大 小 未 知 的 情况 下 ， 更 是 
如 此 。 





5. 0ffsetInDescriptorsFromTableStart: 此 描述 符 范 围 
《range of descriptor〉 距 离 描 述 符 表 起 始 地 址 的 偏 移 量 。 详 见 以 下 示 
例 。 


由 于 我 们 可 能 将 各 种 类 型 的 描述 符 混 合 放置 在 一 个 描述 符 表 中 ， 上 所 
以 会 把 寄存 器 槽 参数 初始 化 为 :一 个 存 有 一 系 
列 D3D12_DESCRIPTOR_RANGE 实 例 的 描述 符 表 。 假 设 我 们 以 “2 个 CBV， 
3 个 SRV 和 1 个 UAV” 这 3 个 描述 符 范 围 的 顺序 指定 了 由 6 个 描述 符 构 成 的 
表 ， 则 此 表 的 定义 为 : 


// 用 2 个 CBV，3 个 SRV 和 1 个 UAV 来 创建 一 个 描述 符 表 
CD3DX12 DESCRIPTOR RANGE descRange[3]; 


descRange[68].Init( 
D3D12_DESCRIPTOR_RANGE_TYPE_CBV，// 描述 符 的 类 型 
2，// 描述 符 的 个 数 
6，// 此 根 参数 将 要 绑 定 到 的 基准 着 色 器 寄存 器 
6，// 寄存 器 空间 
6);// 到 此 描述 表 起 始 地 址 的 偏 移 量 
descRange[1].Init( 
D3D12_DESCRIPTOR_RANGE_TYPE_SRV，// 描述 符 的 类 型 
3，// 描述 符 的 个 数 
8，// 此 根 参数 将 要 绑 定 到 的 基准 着 色 器 寄存 器 
6，// 寄存 器 空间 
2);// 到 此 描述 表 起 始 地 址 的 偏 移 量 
descRange[2].Init( 
D3D12_DESCRIPTOR_RANGE_TYPE_UAV，// 描述 符 的 类 型 
1，// 描述 符 的 个 数 
6，// 此 根 参数 将 要 绑 定 到 的 基准 着 色 器 寄存 器 
6，// 寄存 器 空间 
5);// 到 此 描述 符 表 起 始 地 址 的 偏 移 量 
slotRootParameter[8].InitAsDescriptorTable( 
3, descRange, D3D12 SHADER VISIBILITY ALL); 






































师 




















像 之 前 所 见 的 其 他 辅助 结构 体 一 样 ，CD3DX12_DESCRIPTOR_RANGE 
继承 自 结构 体 D3D12_DESCRIPTOR_RANGE， 我 们 将 使 用 其 中 的 下 列 初始 
函数 : 
void CD3DX12_DESCRIPTOR_RANGE: :Init( 


D3D12_DESCRIPTOR RANGE TYPE rangeType， 
UINT numDescriptors, 


UINT baseShaderRegister, 

UINT registerSpace = 0， 

UINT offsetInDescriptorsFromTableStart = 
D3D12 DESCRIPTOR RANGE OFFSET_ APPEND); 





上 面 配 置 的 描述 符 表 共存 有 6 个 描述 符 ， 而 应 用 程序 期 望 绑 定 摘 述 
符 堆 中 一 块 连续 的 描述 符 范 围 ， 其 中 依次 包含 2 个 CBV、3 个 SRV 和 1 个 
UAV。 我 们 可 以 看 到 所 有 类 型 的 描述 符 表 都 是 以 寄存 器 0 作为 基准 寄存 
器 〈baseShaderRegister) ， 但 是 却 并 没有 发 生 寄存 器 “ 重 登 
(overlap) ”冲突 ， 这 是 因为 CBV、SRV 和 UAV 都 分 别 被 绑 定 在 不 同类 








型 的 寄存 器 上 ， 并 始 于 各 目的 寄存 器 0。 


我 们 能 通过 指定 D3D12_DESCRIPTOR_RANGE_OFFSET_APPEND， 念 
Direct3D 来 计算 OffsetInDescriptorsFromTableSstart 的 值 。 这 将 使 
Direct3D 根 据 表 中 前 一 个 描述 符 范 围 中 摘 述 符 的 数量 来 计算 偏 移 量 。 可 
以 看 出 ，CD3DX12_DESCRIPTOR_RANGE: :Init 方 法 默认 的 寄存 器 空间 
为 0， 且 参数 0ffsetInDescriptorsFromTableStart 的 默认 值 
为 D3D12_DESCRIPTOR RANGE OFFSET_APPEND.。 


7.6.3 ” 根 擅 述 符 


通过 填写 结构 体 D3D12_ROOT_PARAMETER 中 的 成 员 Descriptor， 
即 可 将 根 参数 的 类 型 进一步 定义 为 根 描述 符 (root descriptor) 。 


typedef struct D3D12_ROOT_DESCRIPTOR 
{ 


UINT ShaderRegister; 
UINT RegisterSpace; 
}D3D12_ ROOT_DESCRIPTOR; 





1. ShaderRegister: 此 描述 符 将 要 绑 定 的 着 色 器 寄存 器 。 例 如 ， 
如 果 将 它 指定 为 2， 而 且 此 根 参 数 是 一 个 CBV， 则 此 根 参 数 将 被 映射 
到 register(b2) 中 的 常量 缓冲 区 : 


cbuffer cbPass : register(b2) {...}; 


2. RegisterSpace: 参见 
D3D12 DESCRIPTOR RANGE: :RegisterSpace。 


与 描述 符 表 需要 在 描述 符 堆 中 设置 对 应 的 描述 符 句 柄 不 同 ， 要 配置 
根 描述 符 ， 我 们 只 需 简单 而 又 直接 地 绑 定 资源 的 虚拟 地 址 即 可 。 


UINT objCBByteSize = d3dUtil::CalcConstantBufferByteSize(sizeof 
(ObjectConstants) ) ; 


D3D12_GPU_VIRTUAL_ADDRESS objCBAddress = objectCB->GetGPUVirtualAddress(); 





// 偏 移 到 缓冲 区 中 此 物体 常量 的 地 址 











objCBAddress += ri->0bjCBIndex*objCBByteSize; 


cmdList->SetGraphicsRootConstantBufferView( 
8，// 根 参 数 索 引 ， 即 将 当前 根 描述 符 绑 定 到 此 编号 的 寄存 器 模 位 
objCBAddress) ; [3] 




















7.6.4 ” 根 常 量 


通过 填写 结构 体 D3D12_ROOT_PARAMETER 的 成 员 Constants， 即 可 
进一步 将 根 参 数 的 类 型 定义 为 根 常 量 (root constant) 。 


typedef struct D3D12 ROOT_CONSTANS 


{ 
UINT ShaderRegister; 


UINT RegisterSpace,; 
UINT Num32BitValues; 
} D3D12 ROOT_CONSTANTS; 





1. ShaderRegister: 参见 
D3D12 ROOT_DESCRIPTOR: :ShaderRegister。 


2. RegisterSpace: 参见 
D3D12 DESCRIPTOR RANGE: :RegisterSpace。 


3. Num32BitValues: 此 值 为 根 参 数 所 需 的 32 位 常量 的 个 数 。 


设置 根 常 量 仍 要 将 数据 映射 到 着 色 器 视角 中 的 常量 缓冲 区 内 ， 下 面 
是 此 过 程 的 详细 示例 : 
// 应 用 程序 代码 部 分 : 根 签名 的 定义 


CD3DX12 ROOT_ PARAMETER slotRootParameter[1]; 
slotRootPparameter[8].InitAsConstants(12, 0); 





// 根 签名 即 是 一 系列 根 参 数 
CD3DX12 ROOT_SIGNATURE DESC rootSigDesc(1, slotRootPparameter, 
60, nullptr, 
D3D12 ROOT_SIGNATURE_ FLAG ALLOW INPUT_ ASSEMBLER_ INPUT_LAYOUT); 





// 应 用 程序 代码 部 分 : 将 根 常量 设置 到 寄存 器 b@ 
auto weights = CalcGaussWeights(2.5f); 
int blurRadius = (int)weights.size() / 2; 








cmdList->SetGraphicsRoot32BitConstants(60, 1, &blurRadius, 08); 
cmdList->SetGraphicsRoot32BitConstants(6, (UINT)weights.size(), 
weights.data(), 1); 


// HLSL 代 人 码 部 分 
cbuffer cbSettings : register(b6) 








// 我 们 无 法 获取 常量 缓冲 区 中 映射 有 根 常量 数据 的 数组 元 素 ， 所 以 
单独 列 出 








int gBlurRadius; 


// 最 多 文 持 11 种 模糊 权 值 (blur weight) 
float we; 
float wi1; 
float w2; 
float w3; 
float w4; 
float w5; 
float w6; 
float w7; 
float w8; 
float w9; 
float 





ID3D12GraphicsCommandList: :SetGraphicsRoot32BitConstal 
方法 的 原型 如 下 : 


void ID3D12GraphicsCommandList: :SetGraphicsRoot32BitConstants( 
UINT RootParameterIndex， 


UINT Num32BitValuesToSet, 
const void *pSrcData, 
UINT DestOoffsetIn32BitValues); 





1. RootParameterIndex: 我 们 所 设置 的 根 参数 的 索引 ， 即 将 根 
常量 绑 定 到 此 槽 号 的 寄存 器 。 


2. Num32BitValuesToSet: 本 次 设置 的 32 位 常量 数据 的 个 数 。 





3. pSrcData: 指向 将 要 设置 的 32 位 常量 数据 数组 的 指针 。 





4. DestoffsetIn32BitValues: 本 次 设置 的 第 一 个 常量 数据 在 常 
量 缓冲 区 中 的 偏 移 量 ( 用 一 个 32 位 数 表示 )。 





如 同根 捅 述 符 一 样 ， 设 置 根 常量 时 无 需 涉及 描述 符 堆 。 


7.6.5 ”更 复杂 的 根 签名 示例 





思考 一 下 着 色 器 需要 下 列 资 源 的 情景 : 





Texture2D gDiffuseMap : register(t0); 


cbuffer cbPerObject : register(b6) 


float4x4 gWorld; 
float4x4 gTexTransform; 


}; 


cbuffer cbPass : register(b1) 
{ 

float4x4 gView; 

float4x4 gInvView; 

float4x4 gProj; 

float4x4 gInvProj; 

float4x4 gViewProj; 

float4x4 gInvViewProj; 

float3 gEyePoskW; 

float cbPerObjectPad1; 

float2 gRenderTargetSize; 

float2 gInvRenderTargetSize; 

float gNearz; 

float gFarz; 

float gTotalTime; 

float gDeltaTime; 

float4 gAmbientLight; 

Light gLights[MaxLights]; 
}; 


cbuffer cbMaterial : register(b2) 
{ 

float4 gDiffuseAlbedo; 

float3 gFresnelRe; 

float gRoughness; 

float4x4 gMatTransform; 


}; 





此 着 色 器 对 应 的 根 签名 描述 如 下 : 





CD3DX12 DESCRIPTOR RANGE texTable; 
texTable.Init( 
D3D12 DESCRIPTOR RANGE_TYPE_SRYV, 
1， // 根 签名 的 数量 











6); // 寄存 器 t6 




















// 根 参 数 可 以 是 描述 符 表 ， 根 描述 符 或 根 常 量 
CD3DX12_ROOT_PARAMETER slotRootParameter[4]; 














/ 性 能 小 提示 : 按 变更 频率 高 -> 低 的 顺序 进行 排列 
slotRootParameter[8].InitAsDescriptorTable(1, 

&texTable, D3D12 SHADER VISIBILITY PIXEL); 
slotRootParameter[1].InitAsConstantBufferView(6); // 寄存 器 b6 
slotRootParameter[2].InitAsConstantBufferView(1); // 寄存 器 b1 
slotRootParameter[3].InitAsConstantBufferView(2); // 寄存 器 b2 





// 根 签名 就 是 一 系列 根 参数 

CD3DX12_ROOT_SIGNATURE_DESC rootSigDesc(4, slotRootParameter, 
0, nullptr, 

D3D12 ROOT_SIGNATURE_ FLAG ALLOW INPUT_ ASSEMBLER_ INPUT_LAYOUT); 





7.6.6 ” 根 参 数 的 版 本 控制 


根 实 参 (root argument， 其 实 有 些 文献 也 将 此 翻译 为 * 根 参数 "， 为 
示 区 别 在 此 译 为 “ 根 实 参 *) 即 我 们 同根 参数 传递 的 实际 数值 。 考 虑 下 列 
代码 ， 其 中 ， 我 们 在 每 次 绘制 调用 之 间 都 修改 了 根 实 参 〈 此 例 中 只 有 措 
述 符 表 ) : 
for(size t i = 6; i < mRitems.size(); ++i) 


{ 


const auto& ri = mRitems[i]; 


// 偏 移 到 此 帧 中 泻 染 项 的 CBV 
int cbvoffset = mCurrFrameResourceIndex*(int)mRitems.sizel(); 
cbvoffset += ri.CbIndex; 


cbvHandle.Ooffset(cbvoffset, mCbvSrvDescriptorSize); 























// 指定 此 次 绘制 调用 所 需 的 描述 符 
cmdList->SetGraphicsRootDescriptorTable(86，cbvHandle ) ; 




















cmdList->DrawIndexedInstanced ( 
ri.IndexCount，1， 
ri.StartIndexLocation, 
ri.BaseVertexLocation, 0); 





在 每 次 执行 绘制 调用 时 ， 将 使 用 针对 当前 绘制 调用 所 设置 的 根 实 参 
状态 。 这 个 工作 得 以 实现 全 然 是 因为 : 硬件 会 自动 为 每 次 绘制 调用 保存 
根 实 参 当 时 状态 的 快照 (snapshot) 。 换 句 话说 ， 系 统 会 为 每 次 绘制 调 


用 而 目 动 对 根 参数 进行 版 本 控制 。 








值得 注意 的 是 ， 根 签名 可 以 为 着 色 器 提供 比 实际 所 用 更 多 的 字段 。 
例如 ， 如 果 根 签名 在 根 参 数 2 中 指定 了 一 个 根 CBV， 但 是 着 色 器 却 根本 
不 使 用 该 常量 缓冲 区 ， 然 而 ， 只 要 根 签名 为 着 色 器 传递 了 所 有 必 备 的 数 
据 ， 则 这 个 设置 组 合 就 是 合法 的 。 











考虑 到 性 能 因素 ， 我 们 应 当 使 根 签名 尽 可 能 小 。 其 中 一 个 原因 就 是 
在 每 次 绘制 调用 时 ， 根 实 参 都 会 自动 控制 版 本 。 而 根 签名 越 大 ， 则 根 实 
参 的 快照 也 就 越 大 。 另 外 ，SDK 文 档 建议 : 根 签 名 中 的 根 参 数 应 当 按照 
变更 频率 ， 由 高 至 低 排列 。Direct3D 12 文 档 也 建议 我 们 尽 可 能 避免 频繁 
切换 根 签名 。 因 此 ， 一 个 好 的 办 法 就 是 令 您 创建 的 多 个 PSO 共 享 同一 个 
根 签名 。 特 别 是 ， 有 时 我 们 可 以 得 益 于 多 个 着 色 器 程序 采用 一 个 “ 超 
级 ” 根 签名 的 模式 ， 哪 怕 并 不 是 所 有 的 着 色 器 都 能 充分 利用 该 根 签名 中 
定义 的 全 部 参数 。 但 从 另 一 方面 来 讲 ， 我 们 也 要 考虑 此 “超级 ” 根 签 名 为 
了 实际 需要 所 必须 达到 的 规模 。 如 果 它 过 于 庞大 ， 则 其 无 需 切 换 根 签名 
所 带 来 的 优势 可 能 就 会 因此 而 被 抵消 。 

















7.7 ”| 陆地 与 波浪 演示 程序 


在 本 小 市 中 ， 我 们 将 展示 如 何 构建 图 7.7 所 示 的 “Land and 
Waves”( 陆 地 与 波浪 ) 演示 程序 。 此 示例 构建 了 一 个 三 角形 栅 格 
(grid) ， 并 通过 将 其 中 的 顶点 偏 移 到 不 同 的 高 度 来 创建 地 形 
(terrain) 。 夯 外 ， 还 要 使 用 另 一 个 三 角形 栅 格 来 表现 水 ， 动 态 的 改变 
其 顶点 高 度 来 创建 波浪 。 此 例 程 还 将 针对 不 同 的 常量 缓冲 区 而 切换 所 用 
的 根 描述 符 ， 这 使 我 们 能 够 摆脱 设置 琐 琐 的 CBV 描 述 符 堆 。 








|  d3d App 





fps: 60.000000 mspf: 16.666666 一 口 x 











图 7.7 “Land and Waves” 演 示 程 序 的 效果 。 由 于 我 们 还 未 运用 光照 技术 ， 所 以 很 难看 出 水 面 的 
涟 满 起 伏 。 此 时 ， 按 下 “1” 键 以 线 框 模式 来 观察 场景 不 失 为 一 种 观看 水 面 波 动 的 好 方法 











实 值 函数 y = fl7; 引 的 图 像 是 一 个 曲面 。 我 们 可 以 通过 在 x 平面 内 构 
造 一 个 栅 格 来 近似 地 表示 这 个 曲面 ， 其 中 的 每 个 四 边 形 都 是 由 两 个 三 角 
形 所 构成 的 ， 接 下 来 再 利用 此 函数 计算 出 每 个 栅 格 点 处 的 高 度 即 可 ， 如 


图 7.8 所 示 。 








rr 
图 7.8 。〈 上 图 ) 首先 在 zz 平面 内 "铺设 "一 层 栅 格 。 (下 图 ) 运用 函数 (7; >) 为 每 个 栅 格 点 获 
取 其 对 应 的 VY 坐标 。 再 借助 (T; 了 (ZT; 2), z) 诸 点 即 可 绘制 出 曲面 的 图 像 


7.7.1 生成 栅 格 顶点 


由 以 上 分 析 可 知 ， 我 们 主要 的 任务 就 是 来 构建 zz 平面 内 的 栅 格 。 
m xn 个 顶点 所 构成 的 栅 格 具有 tm 一 Xx (tn 一 了 个 四 边 形 (或 称 单元 
格 ) ， 如 图 7.9 所 示 。 每 个 单元 格 由 两 个 三 角形 组 成 ， 即 有 共 
2 lm 一 1 Xx (n 一 了 个 三 角形 。 如 果 栅 格 的 宽 为 w 且 深度 为 4， 则 单元 格 在 
zf 轴 与 z 轴 方向 上 的 间距 分 别 为 必 二 w/tn 一 1 与 4 = d/(m 一 1)。 为 了 生成 
栅 格 顶点 ， 我 们 从 左上 角 开 始 ， 逐 行 渐进 地 计算 项 点 坐 标 。 在 zz 平面 
中 ， 第 i 行 、 第 j 列 栅 格 顶点 的 坐标 可 以 表示 为 : 

ui = [—0.5w+j:dr, 0.0， 0.5d—i.dz] 


+Z 


(0.5w,0.5d) 




















(0.5w, 一 0.5d) 





Vm—1ln-1 
图 7.9 ” 栅 格 的 结构 


下 列 代 码 用 于 生成 栅 格 顶点 : 





GeometryGenerator: :MeshData 
GeometryGenerator::CreateGrid(float width, float depth, uint32 m, uint32 n 


) 


MeshData meshData ; 


uint32 vertexCount = m*n; 
uint32 faceCount = (m-1)*(n-1)*2; 


float halfWwidth 
float halfDepth 


0.5f*width; 
60.5f*depth; 


float dx = width / (n-1); 
float dz = depth / (m-1); 
float du = / (n-1); 


float dv = 1.6f / (m-1); 


meshData.Vertices.resize(vertexCount); 
for(uint32 i = 6; i < m; ++i) 
{ 
float z = halfDepth - i*dz; 
for(uint32 j = 68; j < nj ++j) 
{ 
float x = -halfWidth + j*dx; 


meshData.Vertices[i*n+j].Position = XMFLOAT3(x, 8.6f, z); 
meshData.Vertices[i*n+j].Normal = XMFLOAT3(6.6f, 1.6f, 06.6f); 
meshData.Vertices[i*n+j].TangentU = XMFLOAT3(1.6f, 68.6f, 6.6f); 




















// 在 栅 格 上 拉 伸 纹理 。 











meshData.Vertices[i*n+j].TexC.x = j*du; 
meshData.Vertices[i*n+j].TexC.y = i*dyv; 





7.7.2 ”生成 栅 格 索引 


完成 顶点 的 计算 之 后 ， 我 们 需要 通过 指定 索引 来 定义 栅 格 三 角形 。 
为 此 ， 我 们 再 次 从 左上 角 出 发 ， 逐 行 过 有 历 每 个 四 边 形 ， 并 计算 索引 以 定 
义 构成 每 个 四 边 形 的 两 个 三 角形 。 参 考 图 7.10 可 以 发 现 ， 对 于 一 个 规模 
为 m x n 顶 点 的 机 格 来 说 ， 四 边 形 中 两 个 三 角形 的 线性 数组 索引 的 计算 


方法 如 下 : 


AABC = (1:n+7, 
ACBD=((i+1):n+t), 


i 十 7 十 J]，(i 十 1):n 十 7) 


i 二 7 十 1，(i 十 1):nn 十 7 十 1) 


第 列 顶 点 第 /+ 1 到 顶点 


洲 
Ee 
二 
二 
汇 
< 
-< 


第 / 行 、 第 / 列 
四 边 形 


第 ;+ 1 行 项 点 


D 


如 和 “0 一 


图 7.10 ”第 ; 行 、 第 7 列 四 边 形 的 顶点 索引 





相应 的 代码 为 : 





meshData.Indices32.resize(faceCount*3); // 每 个 三 角形 面 有 3 个 索引 


// 遍历 每 个 四 边 形 并 计算 索引 
uint32 k = 0; 
for(uint32 i = 606; i < m-1; ++i) 


{ 

for(uint32 j = 686; j < n-1; ++j) 

{ 
meshData.Indices32[k] = i*n+j; 
meshData.Indices32[K+1] = i*n+j+1; 
meshData.Indices32[k+2] = (i+1)*n+j; 
meshData.Indices32[k+3] = (i+1)*n+j; 
meshData.Indices32[K+4] = i*n+j+1; 
meshData.Indices32[k+5] = (i+1)*n+j+1; 
k += 6; // 下 一 个 四 边 形 

} 


return meshData; 
} 


7.7.3 应 用 计算 高 度 的 函数 





待 栅 格 创 建 完成 后 ， 我 们 就 能 从 MeshData 栅 格 中 获取 所 需 的 顶点 
元 素 ， 根 据 顶 点 的 高 度 〈y 坐 标 ) 将 平坦 的 栅 格 变 为 用 于 表现 山峰 起 伏 
的 曲面 ， 并 为 它 生 成 对 应 的 颜色 。 








// 请 不 要 与 GeometryGenerator: :Vertex 结 构 体 相 混淆 
struct Vertex 





{ 
XMFLOAT3 Pos; 


XMFLOAT4 Color; 
}; 
void LandAndWavesApp: :BuildLandGeometry() 
{ 
GeometryGenerator geoGen,; 
GeometryGenerator: :MeshData grid = geoGen.CreateGrid(166.6f，166.6f，56， 
50); 


// 

// 获取 我 们 所 需要 的 顶点 元 素 ， 并 利用 高 度 函 数 计算 每 个 顶点 的 高 度 值 
// 另外 ， 顶 点 的 颜色 要 基于 它们 的 高 度 而 定 

// 所 以 ， 图 像 中 才 会 有 看 起 来 如 沙 质 的 沙滩 、 山 腰 处 的 植被 以 及 山峰 处 的 积 雪 
// 










































































std: :vector<Vertex> vertices(grid.Vertices.sizel()); 
for(size t i = 8; i «< grid.Vertices.size(); ++i) 
{ 
auto& p = grid.Vertices[i].Position,; 
vertices[i].Pos = p; 
vertices[i].Pos.y = GetHillsHeight(p.x, p.z); 





// 基于 顶点 高 度 为 它 上 色 
if(vertices[i].Pos.y < -16.6f) 











// 沙滩 的 颜色 
vertices[i].Color = XMFLOAT4(1.6f, 86.96f, 868.62f, 1.6f); 











else if(vertices[il].Pos.y < 5.6f) 


{ 
// 浅黄 绿色 
vertices[i].Color = XMFLOAT4(6.48f，6.77f，6.46f，1.6f); 


} 
else if(vertices[il].Pos.y < 12.6f) 





{ 
// 深 黄 绿色 
vertices[i].Color = XMFLOAT4(6.1f，6.48f，6.19f，1.6f) 


} 
else if(vertices[il].Pos.y < 26.6f) 


{ 

// 深 标 色 

vertices[i].Color = XMFLOAT4(8.45f, 06.39f, 8.34f, 1.6f); 
} 


else 








// 白雪 能 抱 
vertices[i].Color 


} 





XMFLOAT4(1.6f, 1.6f, 1.6f, 1.6f); 


} 


const UINT vbByteSize = (UINT)vertices.size() * sizeof(Vertex); 


std: :Vector<std: :uint16 t> indices = grid.GetIndices16(); 
const UINT ibByteSize = (UINT)indices.size() * sizeof(std::uint16 七 ) ; 


auto geo = std::make unique<MeshGeometry>(); 
geo->Name = "landGeo"; 


ThrowIfFailed(D3DCreateBlob(vbByteSize, &geo->VertexBufferCPU)); 
CopyMemory (geo->VertexBufferCPU->GetBufferpointer(), vertices.datal(), 
vbByteSize); 


ThrowIfFailed(D3DCreateBlob(ibByteSize, &geo->IndexBufferCPU)); 
CopyMemory (geo->IndexBufferCPU->GetBufferpointer(), indices.data(), 
ibByteSize); 


geo->VertexBufferGPU = d3dUtil::CreateDefaultBuffer(md3dDevice.Get(), 
mCommandList.Get(), vertices.data(), vbByteSize, geo->VertexBufferUplo 
ader); 


geo->IndexBufferGPU = d3dUtil::CreateDefaultBuffer(md3dDevice.Get(), 
mCommandList.Get(), indices.data(), ibByteSize, 
geo->IndexBufferUploader); 


geo->VertexByteStride = sizeof(Vertex); 
geo->VertexBufferByteSize = vbByteSize; 


geo->IndexFormat = DXGI_FORMAT_R16_UINT ; 
geo->IndexBufferByteSize = ibByteSize; 


SubmeshGeometry submesh ; 

submesh. IndexCount = (UINT)indices.sizel(); 
submesh .startIndexLocation 0 
submesh.BaseVertexLocation 0; 


geo->DrawArgs["grid"] = submesh; 


mGeometries["landGeo"] = std: :move(geo) ; 





在 此 演示 程序 中 使 用 的 函数 帮 7, 3) 为 : 


float LandAndwWavesApp::GetHillsHeight(float x, float z)const 
{ 


return 0.3f*(z*sinf(0.1f*x) + x*cosf(0.1f*z)); 
} 





最 后 得 到 的 图 像 看 起 来 就 似 山川 地 形 (参见 图 7.7) 。 
7.7.4 根 和 常量 缕 冲 区 视图 
此 “Land and Waves” 演 示 程 序 较 之 前 “Shape” 例 程 的 男 一 个 区 别 是 : 


我 们 在 前 者 中 使 用 了 根 掺 述 符 ， 因 此 就 可 以 捍 脱 描述 符 堆 而 直接 绑 定 
CBV 了。 为 此 ， 程 序 还 要 做 如 下 改动 : 





1. 根 签名 需要 变 为 取 两 个 根 CBV， 而 不 再 是 两 个 描述 符 表 。 
2. 不 采用 CBV 推 ， 更 无 需 同 其 填充 描述 符 


.涉及 一 种 用 于 绑 定 根 擅 述 符 的 新 语法 。 


新 的 根 签 名 定义 如 下 : 





// 根 参 数 可 以 是 描述 符 表 ， 根 擅 述 符 或 根 第 量 
CD3DX12_ROOT_PARAMETER slotRootParameter[2]; 























// 创建 根 CBV。 
slotRootParameter[6].InitAsConstantBufferView(6); // 物体 的 CBV 


slotRootParameter[1].InitAsConstantBufferView(1); // 渲染 过 程 CBV 





// 根 签名 即 是 一 系列 根 参数 的 组 合 
CD3DX12_ROOT_SIGNATURE_DESC rootSigDesc(2, slotRootPparameter, 0, 
nullptr, D3D12 ROOT_ SIGNATURE FLAG ALLOW INPUT ASSEMBLER INPUT_ LAYOUT); 

















由 此 可 以 看 出 ， 我 们 使 用 辅助 方法 InitAsConstantBufferView 来 
创建 根 CBV， 并 通过 其 参数 来 指定 此 根 参 数 将 要 绑 定 的 着 色 器 寄存 器 
(在 上 面 的 示例 中 ， 指 定 的 着 色 器 常量 缓冲 区 寄存 器 分 别 
为 “b0” 和 “b1”) 





现在 ， 让 我 们 利用 下 列 方法 ， 以 传递 参数 的 方式 将 CBV 与 茶 个 根 描 
述 符 相 绑 定 : 


void 
ID3D12GraphicsCommandList::SetGraphicsRootConstantBufferView( 


UINT RootParameterIndex， 
D3D12 GPU_ VIRTUAL ADDRESS BufferLocation); 





1. RootParameterIndex: CBV 将 要 绑 定 到 的 根 参 数 索 引 ， 即 寄 
存 器 的 槽 位 号 。 


2. BufferLocation: 含有 常量 缓冲 区 数据 资源 的 虚拟 地 址 。 
经 过 此 次 变化 ， 我 们 的 绘制 代码 现在 看 起 来 是 这 样 的 : 


void LandAndWavesApp: :Draw(const GameTimer& gt) 








// 绑 定 泻 染 过 程 中 所 用 的 常量 缓冲 区 。 在 每 个 泻 染 过 程 中 ， 这 段 代 码 只 需 执 行 一 次 

auto passCB = mCurrFrameResource->PassCB->Resource( ) ; 

mCommandList->SetGraphicsRootConstantBufferView(1, passCB-> 
GetGPUVirtualAddress()); 




















DrawRenderItems(mCommandList.Get(), mRitemLayer[(int)RenderLayer::0paque 


]); 


void LandAndWavesApp: :DrawRenderItems( 


{ 


ID3D12GraphicsCommandList* cmdList， 
const std::vector<RenderItem*>& ritems) 


UINT objCBByteSize = d3dUtil::CalcConstantBufferByteSize(sizeof 
(ObjectConstants)); 


auto objectCB = mCurrFrameResource->0bjectCB->Resource(); 


// 对 于 每 个 演 染 项 来 说 ..… 
for(size t i = 606; i < ritems.size(); ++i) 


{ 





auto ri = ritems[i]; 


cmdList->IASetVertexBuffers(60, 1, &ri->Geo->VertexBufferView!()); 
cmdList->IASetIndexBuffer(&ri->Geo->IndexBufferView()); 
cmdList->IASetPprimitiveTopology(ri->primitiveType); 


D3D12_GPU_VIRTUAL ADDRESS objCBAddress = objectCB->GetGPUVirtualAddres 


s(); 


objCBAddress += ri->0bjCBIndex*objCBByteSize; 


cmdList->SetGraphicsRootConstantBufferView(6@, objCBAddress); 


cmdList->DrawIndexedInstanced(ri->IndexCount, 1,， 
ri->StartIndexLocation, ri->BaseVertexLocation, 08); 





7.7.5 ”动态 顶点 缓冲 区 


到 目前 为 止 ， 我 们 始终 都 将 顶点 数据 存 于 默认 的 缓冲 区 资源 当中 ， 
可 借 此 存储 静态 几何 体 。 这 就 是 说 ， 我 们 不 能 动态 地 改变 此 资源 中 所 存 
的 几何 体 一 一 只 能 一 次 性 设置 好 数据 ， 再 以 GPU 读 取 其 中 的 数据 并 进行 
绘制 。 此 时 ， 一 种 名 为 动态 项 点 缓冲 区 (dynamic vertex buffer) 的 资源 
应 运 而 生 ， 它 允许 用 户 频 繁 地 更 改 其 中 的 顶点 数据 。 比 如 说 ， 我 们 可 在 
每 一 帧 都 修改 其 中 的 顶点 数据 。 现 假设 我 们 正在 模拟 波浪 的 运动 ， 第 一 
步 束 是 要 求 出 函数 7,3, 芭 此 波浪 方程 的 解 。 该 函数 表示 的 是 :在 t 时 
刻 ， 位 于 zz 平面 内 每 个 点 处 的 波浪 高 度 。 如 果 采 用 这 个 函数 来 绘制 波 
浪 ， 我 们 应 使 用 之 前 绘制 山峰 和 谷地 时 所 用 的 三 角形 栅 格 ， 利 用 此 函数 
fl7,3, 针 对 每 个 栅 格 点 进行 计算 ， 以 此 求 出 位 于 每 个 栅 格 点 处 的 波浪 
高 度 。 由 于 该 函数 依赖 于 时 间 +《〈 即 波 面 随时 间 发 生变 化 ) ， 我 们 就 需 
要 在 短 时 间 内 《比如 说 每 1130 秒 ) 多 次 调用 此 函数 ， 从 而 获得 平滑 的 动 
画 效 果 。 这 样 一 来 ， 我 们 便 需 要 创建 一 个 动态 顶点 缓冲 区 ， 随 着 时 间 的 
流 走 而 更 新 三 角形 栅 格 顶点 的 高 度 。 另 一 种 要 用 到 动态 项 点 缓冲 区 的 情 
况 是 : 需要 执行 复杂 的 物理 模拟 计算 和 碰撞 检测 (collision detection ) 
的 粒子 系统 (particle system ) 。 在 该 系统 中 ， 为 了 找寻 每 个 粒子 的 新 位 
置 ， 我 们 在 每 一 帧 都 要 用 CPU 进行 物理 模拟 计算 以 及 磁 撞 检测 。 由 于 粒 
子 的 位 置 在 每 一 帧 都 会 有 所 变化 ， 因 此 ， 我 们 就 需要 在 绘制 每 一 帧 时 借 
助 动 态 顶点 缓冲 区 来 更 新 粒子 的 位 置 。 

















在 通过 上 传 缓冲 区 来 更 新 常量 缓冲 区 中 的 数据 时 ， 我 们 已 经 接触 过 
由 CPU 在 每 一 帧 同 GPU 上 传 数据 的 具体 流程 。 使 用 之 前 编写 的 
UploadBuffer 类 即 可 重 施 故 技 ， 但 是 这 次 存储 的 资源 是 项 点数 组， 而 
非常 量 缓冲 区 数组 : 


std: :unique_ptr<Up1loadBuffer<Vertex>> WavesVB = nullptr; 


WavesVB = std::make unique<UploadBuffer<Vertex>>( 
device, waveVertCount, false); 





由 于 我 们 在 每 一 帧 都 要 从 CPU 同 波浪 动态 顶点 缓冲 区 上 传 新 的 数据 
内 容 ， 所 以 需要 将 动态 顶点 缓冲 区 存 为 一 种 帧 资源 。 知 非 如 此 ， 我 们 就 
有 可 能 在 GPU 未 完成 最 近 一 帧 的 处 理 之 前 就 窗 写 了 相关 内 存 中 的 数据 。 





在 每 一 帧 中 ， 我 们 都 以 下 列 方式 来 模拟 波浪 并 更 新 顶点 缓冲 区 : 





void LandAndWavesApp: :UpdateWaves(const GameTimer& gt) 
{ 

// 每 隔 1/4 秒 就 要 生成 一 个 随机 波浪 

static float 七 base = 0.6f; 

if((mTimer.TotalTime() -七 base) >= 6.25f) 


{ 
t_ base += 0.25f; 


int i 
int j 


MathHelper: :Rand(4, mWaves->RowCount() - 5); 
MathHelper: :Rand(4, mWaves->ColumnCount() - 5); 


float r = MathHelper: :RandF(6.2f, 8.5f); 


mWaves->Disturb(i, j, r); 


} 


// 更 新 模拟 的 波浪 
mWaves->Update(gt.DeltaTime()); 











// 用 波浪 方程 求 出 的 新 数据 来 更 新 波浪 项 点 缓冲 区 
auto currWavesVB = mCurrFrameResource->WavesVB.get(); 
for(int i = 6; i < mWaves->VertexCount(); ++i) 


{ 


Vertex v; 








v.Pos = mWaves->Position(i); 
v.Color = XMFLOAT4(DirectX::Colors::Blue); 


currWavesVB->CopyData(i, v); 


// 将 波浪 泻 染 项 的 动态 顶点 缓 冲 区 设置 到 当前 帧 的 顶点 缓冲 区 


mWavesRitem->Geo->VertexBufferGPU = currWavesVB->Resource(); 





} 





注意 Note i 


我 们 保存 了 一 份 波 浪 演 染 项 的 引用 (mWavesRitem) ， 从 而 可 以 动 
态 地 调整 其 顶点 缓冲 区 。 由 于 泻 染 项 的 顶点 缓冲 区 是 个 动态 的 缓冲 区 ， 
并 且 每 一 帧 都 在 发 生 改 变 ， 因 此 这 样 做 很 有 必要 。 


在 使 用 动态 缓冲 区 时 会 不 可 避免 的 产生 一 些 开销 ， 因 为 必须 将 新 数 
气 从 CPU 器 内 存 回 传 至 GPU 端 显存 。 这 样 说 来 ， 如 宁静 态 缓冲 区 能 实现 
相同 的 工作 ， 那 么 应 当 比 动态 缓冲 区 更 受 青 睐 。Direct3D 在 最 近 的 版 本 
中 已 经 引入 新 的 特性 ， 以 减少 对 动态 缓冲 区 的 需求 。 例 如 : 





1. 简单 的 动画 可 以 在 顶点 着 色 器 中 实现 。 





2. 可 以 使 用 泻 染 到 纹理 〈render to texture) ， 或 者 计算 着 色 器 
(compute Shader) 与 顶点 纹理 拾取 (vertex texture fetch) 等 技术 来 实现 
上 述 波 浪 模 拟 ， 而 且 全 程 此 是 在 GPU 中 进行 的 。 





3. 几何 着 色 器 为 GPU 创建 或 销毁 图 元 提供 了 文 持 ， 在 几何 着 色 器 
出 现 之 前 ， 一 般 用 CPU 来 处 理 相 关 任 务 。 


4. 在 曲面 细 分 阶段 中 可 以 通过 GPU 来 对 几何 体 进行 镶嵌 化 处 理 ， 


在 硬件 曲面 细 分 出 现 之 前 ， 通 常用 CPU 来 处 理 相 关 任 务 。 


我 们 也 可 以 用 动态 绥 冲 区 来 创建 索引 缓冲 区 。 然 而 ， 在 “Land and 
Waves” 演 示 程 序 中 ， 由 于 三 角形 的 拓扑 结构 保持 不 变 ， 而 仅 修 改 了 顶点 
的 高 度 ， 因 此 只 需 将 顶点 缓冲 区 设置 为 动态 缓冲 区 即 可 。 


本 章 中 的 “Land and Waves” 例 程 通过 一 个 动态 顶点 绥 冲 区 实现 了 本 
节 开 端 所 描述 的 简易 波浪 模拟 。 对 于 本 书 来 说 ， 我 们 并 没有 涉及 波浪 模 
拟 的 具体 算法 细节 〈 对 此 请 见 [Lengyel02]) ， 而 是 把 重心 更 多 地 放 在 与 
动态 缓冲 区 有 关 的 处 理 流 程 之 上 : 即 用 CPU 来 更 新 波浪 的 模拟 数据 ， 再 
通过 上 传 缓冲 区 更 新 项 点 数据 。 


注音 Note > 


再 次 重申 : 此 演示 程序 也 可 以 通过 如 演 染 到 纹理 ， 或 者 计算 着 色 器 
以 及 顶点 纹理 拾取 等 高 级 技术 在 GPU 上 加 以 实现 。 由 于 我 们 现在 还 未 讲 
到 这 些 主题 ， 所 以 此 波浪 模拟 程序 依然 要 在 CPU 上 运行 ， 并 借助 动态 顶 
点 缓冲 区 来 更 新 顶点 数据 。 





7.8 ”小 结 


1. 在 每 帧 中 等 待 GPU 处 理 完 队列 中 所 有 命令 的 做 法 效率 极 低 ， 
为 这 种 策略 在 某 些 时 刻 会 导致 CPU 或 GPU 处 于 空闲 状态 。 一 种 更 有 效 的 
技巧 是 创建 由 资源 〈frame resource) 一 一 一 个 由 每 帧 都 需 CPU 来 修改 的 
资源 所 构成 的 环形 数组 。 这 种 方法 令 CPU 无 需 等 待 GPU 结 束 当 前 的 任 
务 ， 即 可 继续 处 理 下 一 帧 的 相关 工作 ; 对 此 ，CPU 只 需 处 理 下 一 个 可 用 
的 《 即 GPU 没 在 使 用 中 的 ) 帧 资源 。 如 果 CPU 处 理 帧 的 速度 总 是 快 于 
GPU， 则 CPU 必 在 某 些 时 刻 等 待 GPU 追 赶 上 来 ， 但 此 情景 又 正 是 我 们 所 
期 盼 的 :不仅 GPU 的 处 理 能 力 将 得 到 充分 的 发 挥 ， 同 时 ， 多 出 来 的 CPU 
资源 又 总 是 可 被 游戏 的 其 他 部 分 ， 如 AI， 物 理 模 拟 与 游戏 逻辑 所 利用 。 





2. 我 们 可 以 
用 ID3D12DescriptorHeap::GetCPUDescriptorHandleForHeapStar 
方法 来 获取 堆 中 第 一 个 描述 符 的 句柄 ， 通 过 
ID3D12Device: :GetDescriptorHandleIncrementSize 方 法 得 到 描 
述 符 的 大 小 《依赖 于 硬件 与 描述 符 的 类 型 ) 。 一 旦 知道 了 擅 述 符 增 量 的 
大 小 ， 我 们 就 能 用 两 种 CD3DX12_CPU_DESCRIPTOR_HANDLE: :Offset 
方法 之 一 仿 移 至 第 n 个 揪 述 符 的 句柄 处 : 


























// 指定 要 侦 移 到 的 描述 符 的 编号 ， 再 将 它 乘 以 描述 符 的 增 量 大 小 














D3D12 CPU_DESCRIPTOR_HANDLE handle = mCbvHeap-> 
GetCPUDescriptorHandleForHeapStart(); 
handle.Offset(n * mCbvSrvDescriptorSize); 








// 或 者 用 男 一 种 等 价 实现 ， 先 指定 要 偏 移 到 的 描述 符 编号， 再 设置 描述 符 的 增 量 大 小 
D3D12_CPU_DESCRIPTOR_HANDLE handle = mCbvHeap-> 


GetCPUDescriptorHandleForHeapStart(); 
handle.offset(n, mCbvSrvDescriptorSize); 
CD3DX12_GPU_DESCRIPTOR_HANDLE 类 型 有 着 同样 的 偏 移 方法 。 


3. 根 签名 定义 了 在 绘制 调用 开始 之 前 ， 需 要 与 泻 染 流水 线 相 绑 定 
的 资源 ， 以 及 这 些 资源 将 被 映射 到 的 具体 着 色 器 输入 寄存 器 。 绑 定 到 流 
水 线 的 具体 资源 要 根据 着 色 器 程序 来 确定 。 在 创建 PSO 后 ， 根 签名 与 着 
色 器 程序 的 组 合 就 开始 生效 了 。 根 签名 由 一 系列 根 参 数 所 构成 。 根 参数 
可 以 是 描述 符 表 、 根 描述 符 或 根 常 量 。 描 述 符 表 在 堆 中 指定 了 一 块 描述 
符 的 连续 范围 。 根 描述 符 用 于 直接 绑 定 根 签名 中 的 描述 符 《〈 此 过 程 无 需 
涉及 描述 符 堆 ) 。 而 根 常 量 则 用 于 直接 绑 定 根 签 名 中 的 常量 数据 。 出 于 
性 能 的 原因 ，1 个 根 签名 中 所 能 容纳 的 数据 大 小 被 限制 为 最 多 64 
DWORD。 每 个 描述 符 表 占 1 DWORD， 每 个 根 描 述 符 用 2 DWORD， 而 
每 个 32 位 的 根 常量 占用 1 DWORD。 硬 件 会 为 每 次 绘制 调用 而 自动 保存 
根 实 参 的 快照 。 这 样 一 来 ， 我 们 就 能 在 每 次 绘制 调用 的 过 程 中 安全 地 修 
改 根 实 参 了 。 但 是 ， 我 们 也 应 当 尽 量 缩小 根 签名 的 规模 ， 以 此 降低 内 存 
间 数 据 的 复制 量 。 


























4. 当 顶 点 缓冲 区 的 内 容 在 运行 时 需要 频繁 更 新 (比如 在 每 一 帧 ， 
或 每 /30 秒 就 要 更 新 一 次 ) ， 动 态 顶 点 缓冲 区 就 派 上 了 有 用场。 我们 可 以 
使 用 UploadBuffer 类 来 实现 动态 顶点 缓冲 区 ， 但 这 次 存储 的 是 顶点 数 
组 ， 而 非常 量 缓冲 区 数组 。 由 于 我 们 在 每 一 帧 都 要 从 CPU 同 波浪 动态 顶 
点 缓冲 区 上 传 新 数据 ， 所 以 需要 将 动态 顶点 缓冲 区 存 为 一 种 帧 资源 。 在 
使 用 动态 顶点 缓冲 区 的 过 程 中 ， 难 免 会 产生 一 些 开 销 ， 这 是 因为 新 数据 
必 将 从 CPU 端 内 存 回 传 至 GPU 端的 显存 。 因 此 ， 在 静态 顶点 缓冲 区 也 可 














以 胜任 相同 工作 的 情况 下 ， 它 会 比 动态 顶点 缓冲 区 更 受 青睐 。 对 此 ， 
Direct3D 的 最 新 版 本 已 经 引进 了 一 些 新 的 特性 ， 以 减少 动态 缓冲 区 的 使 
用 。 


7.9 练习 


1. 修改 “Shapes” 例 程 ， 以 
GeometryGenerator: :CreateGeosphere 方 法 蔡 换 程 序 中 的 
GeometryGenerator: :CreateSphere 方 法 ， 并 分 别 尝试 使 用 0、1、 


2、3 这 4 种 细 分 等 级 。 


2. 修改 “Shapes” 演 示 程 序 ， 用 16 个 根 常量 来 取代 描述 符 表 ， 以 此 
设置 物体 的 世界 矩阵 。 


3. 在 本 书 配 套 资 源 中 ， 有 一 个 名 为 Models/Skull.txt 的 文件 。 此 文件 
含有 泻 染 图 7.11 中 骨 体 头 所 需 的 顶点 列表 和 索引 列表 。 通 过 使 用 像 记事 
本 上 这 样 的 文本 编辑 器 来 查阅 此 文件 ， 并 修改 “Shapes” 演 示 程 序 来 加 载 
和 泻 染 此 髓 髓 头 网 格 。 























图 7.11 练习 4 的 泻 染 输出 效果 


[1] 预览 版 中 ID3D12CommandQueue 接 口 的 
GetLastCompletedFence() 与 SetEventOnFenceCompletion() 方 
法 ， 在 正式 版 里 已 取消 ， 并 由 ID3D12Fence 接 口 的 
GetCompletedValue() 与 SetEventOnCompletion() 方 法 蔡 代 。 








[2] D3D12_ROOT_PARAMETER 用 于 描述 根 签名 1.0， 而 根 签名 1.1 则 
用 D3D12_ROOT_PARAMETER1 来 加 以 描述 。 


[3] 此 函数 的 细节 请 参见 7.7.4 节 。 








[4] 对 这 种 大 数据 文件 感 兴趣 的 话 ， 最 好 不 要 用 记事 本 ， 上 兆 的 文本 开 
起 来 要 花 若干 秒 。 推 荐 尝试 sublime， 或 直接 在 VS 里 开启 。 


第 8 间 ”光照 


我 们 先 来 考虑 图 8.1， 其 中 左 侧 是 不 受 光照 的 球体 ， 右 侧 是 受到 光 
照 的 球体 。 正 如 我 们 所 见 ， 左 侧 的 球体 看 起 来 过 于 扁平 一 一 似乎 完全 不 
像 是 一 个 球体 ， 而 仅 是 一 个 2D 圆 片 。 而 右 侧 的 球体 则 看 起 来 是 颇具 立 
体 效 果 一 一 光照 〈lighting) 和 阴影 (shading) 不 仅 使 我 们 感受 到 目标 
物体 的 实体 形状 ， 还 展现 出 了 它 的 体积 感 。 事 实 上 ， 我 们 在 视觉 上 对 世 
界 的 感知 依靠 的 是 光照 及 其 与 材质 (material) 的 交互 。 因 此 ， 在 生成 
逼真 场景 的 众多 问题 之 中 ， 首 先 要 解决 的 就 是 遵循 自然 规律 实现 精确 的 
光照 模型 (ighting model) 。 











Qa) (b) 


图 8.1 球体 在 有 无 光照 情形 下 的 比较 
(a) 不 受 光 照 的 球体 看 起 来 像 是 2D 的 圆 形 
(b) 受 光照 射 的 球体 看 上 去 具有 立体 感 





























当然 ， 一 般 来 讲 ， 模 型 越 精确 则 相应 的 计算 代价 也 就 越 高 郧 。 这 区 
a 例如 ， 对 于 电影 的 
3D 特 效 场景 而 言 ， 可 以 采用 比 游戏 更 复杂 、 更 真实 的 光照 模型 ， 这 是 
因为 电影 的 每 一 由 都 有 预 宣 染 处 理 流程 ， 所 以 工作 者 可 以 用 几 小 时 乃至 





儿 天 的 时 间 来 处 理 1 帧 画面 。 相 对 来 讲 ， 游 戏 古 一 种 实时 《real-time) 应 
用 程序 ， 因 此 每 秒 至 少 有 30 帧 的 画面 需要 绘制 。 


注意 ， 本 书 对 光照 模型 的 讲解 与 实现 ， 大 部 分 是 基于 [M6ller08] 中 
的 描述 。 


学 习 目 标 : 


1. 对 光照 与 材质 的 交互 有 基本 的 理解 。 





2. 了 解 局 部 光照 与 全 局 光照 之 间 的 差异 。 


3. 探究 如 何 用 数学 来 摘 述 位 于 物体 表面 上 茶点 的 “朝向 ”， 以 此 来 
确定 入 射 光 照射 到 表面 的 角度 。 


4. 学 习 如 何 正确 地 变换 法 癌 量 。 


5. 能 够 区 分 环境 光 、 漫 反射 光 以 及 镜面 光 。 





6. 学 习 如 何 实现 平行 光 、 点 光 以 及 聚光灯 这 3 种 光源 。 


7. 理解 如 何 通过 控制 距离 函数 的 衰减 参数 来 实现 各 种 不 同 的 光照 
强度 。 


8.1 光照 与 材质 的 交互 


在 开启 光照 的 同时 ， 我 们 不 再 直接 指出 项 点 的 闫 色 ， 而 是 指定 材质 
与 光照 ， 再 运用 光照 方程 Uighting equation ) 基于 两 者 的 交互 来 计算 顶 
点 颜色 。 这 样 做 会 使 物体 的 颜色 更 趋 于 真实 〈 可 再 次 比较 图 8.1a 与 图 
8.1b 之 间 的 天 壤 之 别 〉。 








我 们 可 以 把 材质 看 作 是 确定 光照 与 物体 表面 如 何 进行 交互 的 属性 
集 。 此 属性 集中 的 属性 有 : 表面 反射 光 和 吸收 光 的 颜色 、 表 面 下 材质 的 
折 冉 紊 、 表 面 的 光滑 度 以 及 表面 的 透明 度 。 通 过 指定 材质 属性 ， 我 们 区 
能 为 真实 世界 中 如 木材 、 石 头 、 玻 璃 、 金 属 以 及 水 等 不 同 种 类 的 物质 表 
面 进 行 建 模 。 


在 我 们 所 建 的 模型 中 ， 光 源 可 以 发 出 各 种 强度 (intensity〉 的 红 、 
绿 、 赣 三 色 混 合 光 。 通 过 这 种 方式 ， 我 们 就 能 模拟 出 多 种 多 样 的 光源 颜 
色 。 当 光线 从 光源 发 出 回 外 传播 并 触 碰 到 某 个 物体 时 ， 一 部 分 光线 可 能 
会 被 吸收 ， 而 另 一 部 分 光线 则 将 被 反射 《对 于 玻璃 这 类 透明 的 物体 来 
说 ， 部 分 光线 能 够 透 过 介质 medium， 也 作 媒 质 ) ， 但 我 们 和 暂 不 考虑 
这 种 情况 ) 。 被 反射 的 光线 会 沿 大 它 的 新 路 径 传播 ， 并 有 可 能 再 次 磁 到 
其 他 物体 ， 发 生 二 次 吸收 与 反射 。 因 此 ， 还 会 发 生 这 样 一 种 情况 ， 那 就 
是 在 光线 在 碰 到 足够 多 的 物体 后 被 完全 吸收 了 。 而 一 些 剩 余 的 光线 最 终 
可 能 会 传 入 观察 者 的 眼中 《〈 见 图 8.2) 并 照射 到 视网膜 上 的 感光 细胞 
《 视 锥 细胞 与 视 杆 细胞 的 统称 ) 。 





(a) 


图 8.2 (a) 白色 的 入 射 光 ”〈b) 光线 触 碰 到 圆柱 体 ， 一 部 分 被 吸收 ， 其 他 部 分 则 散射 到 观察 
者 的 眼中 或 球体 上 c) 从 圆柱 体 反 射出 的 光线 或 被 球体 吸收 ， 或 被 球体 再 次 反射 ， 或 直接 传 
播 至 观察 者 的 眼中 〈d) 观察 者 眼中 所 接收 到 的 入 射 光 决定 了 他 所 看 到 的 内 容 





根据 三 色 论 (trichromatic theory， 又 称 三 色 说 等 ， 参 见 
[Santrock03]〉， 视 网 膜 含 有 3 种 光 受 体 ， 分 别 对 于 红 、 绿 和 蓝 三 色光 敏 
感 〈“ 有 部 分 重 登 ) 。RGB 入 射 光 刺激 其 相应 的 光 受 体 ， 基 于 光线 的 强度 
而 产生 不 同 程 度 的 刺激 。 光 受 体 受 到 刺激 (或 没有 受到 刺激 〉 将 神经 冲 
动 沿 着 视神经 传 全 大 脑 ， 而 大 脑 再 根据 光 受 体 所 受到 的 刺激 在 观察 者 的 
头脑 中 生成 相应 的 画面 《当然 ， 如 采 我 们 合 眼 或 将 眼 部 遮 靖 ， 则 受 体 细 
胞 便 不 会 受到 刺激 ， 大 脑 些 时 辨识 的 只 有 黑色 〉。 











举 个 例子 吧 ， 再 次 观察 图 8.2 并 思考 这 样 一 种 情况 : 假设 光源 发 出 
的 是 纯 白 色 的 区。 圆柱 体 反 射 75% 的 红 光 、75% 的 绿 光 ， 并 吸收 了 其 余 
的 光 。 而 球体 反射 了 25% 的 红 光 ， 并 吸收 了 其 余 的 光 。 由 于 光线 照射 到 
圆柱 体 时 ， 所 有 的 蓝光 被 吸收 ， 只 有 75% 的 红 光 和 绿 光 被 反射 出 去 《〈“ 即 
中 高 强度 的 黄色 光线 ) 。 这 些 一 部 分 
射 入 观察 者 眼 内 ， 一 部 分 绷 铸 球体 传播 。 射 入 眼中 的 那 部 分 光线 主要 刺 
激 红色 与 绿色 的 视 锥 细胞 使 之 较为 兴奋 ， 因 此 观察 者 会 看 到 呈 半 光亮 








Csemi-bright) 黄色 的 圆柱 体 。 就 在 此 时 ， 其 他 部 分 光线 将 继续 传播 到 
球体 并 与 之 触 磁 。 球 体 反 射 25% 的 红 光 并 吸收 其 余 光 线 ， 因 此 ， 这 些 强 
度 本 已 变 弱 的 入 射 红 光 “〈 中 高 强度 红色 ) 将 被 进一步 减弱 并 反射 ， 而 所 
有 的 入 射 绿 光 则 皆 补 吸收 。 这 些 剩 余 的 红 光 会 射 入 观察 者 眼中 ， 主 要 刺 
激 红 色 视 锥 细胞 ， 由 于 刺激 不 强 ， 产 生 的 兴奋 程度 并 不 高 ， 因 此 观察 者 
会 看 到 着 色 为 暗 红 色 的 球体 。 


在 本 书 中 《以 及 大 多 数 实时 应 用 程序 ) 所 采用 的 光照 模型 均 为 局 部 
光照 模型 〈local ilumination model) 。 若 使 用 这 种 局 部 模型 ， 则 每 个 物 
体 的 光照 缘 独 立 于 其 他 物体 ， 我 们 也 就 可 以 在 处 理光 照 的 过 程 中 仅 考 虑 
光源 直接 发 出 的 光线 《〈 即 在 处 理 当前 的 物体 光照 时 ， 忽 略 来 自 场景 中 其 
他 物体 所 反弹 来 的 光 ) 。 图 8.3 展 示 了 此 模型 的 效 末 。 








图 8.3 ”从 正常 的 物理 角度 来 说 ， 图 中 的 这 堵 墙 挡住 了 电灯 泡 所 发 出 光线 的 去 路 ， 而 球体 则 会 生 
活 在 墙壁 的 阴影 之 下 。 但 是 在 局 部 光照 模型 中 ， 这 个 球体 却 受到 了 光 的 照射 ， 似 乎 这 堵 墙 就 不 
曾 存在 过 








谈 及 全 局 光照 模型 (global ilumination model) ， 除 了 要 考虑 由 光 
源 直 接 发 出 的 光 ， 还 要 顾及 场景 中 其 他 物体 所 反弹 来 的 间接 光照 。 之 所 


以 称 为 全 局 光照 模型 ， 是 因为 在 对 一 个 物体 进行 照明 时 ， 还 要 考虑 全 局 
场景 中 的 所 有 事物 。 全 局 光照 模型 的 开销 通常 是 实时 游戏 所 负担 不 起 的 
《但 是 这 种 模型 会 生成 十 分 接近 于 照片 级 真实 感 的 场景 ) 。 接 近 于 全 局 
光照 的 实时 方法 尚 处 于 研究 阶段 。 例 如 ， 立 体 像素 全 局 光照 〈voxel 
global illumination ) 技术 (可 参见 文献 《Practical Real-Time Voxel-Based 
Global Illumination for Current GPUs》) 。 男 一 种 流行 的 方法 是 预计 算 
议 态 物体 (如 墙壁 、 塑 像 〉 的 间接 光照 ， 再 用 得 到 的 结果 来 近似 地 模拟 
动态 物体 〈 如 可 运动 游戏 角色 ) 的 间接 光照 。 





8.2 ”法 癌 量 





平面 法 线 〈face normal， 由 于 在 计算 机 几何 学 中 法 线 是 有 方 癌 的 回 
量 ， 所 以 也 有 将 normal 译 作法 癌 量 ) 是 一 种 摘 述 多 边 形 朝 同 〈 即 正 交 于 
I 的 单位 同 量 ， 如 图 8.4a 所 示 。 曲 面 法 线 (surface 
normal) 是 一 种 垂直 于 曲面 上 一 点 处 切 平面 (有 文献 强调 还 要 满足 曲面 
法 线 经 过 该 点 这 一 条 件 ) 的 单位 癌 量 ， 如 图 8.4b 所 示 。 根 据 曲 面 法 线 即 
可 确定 对 应 曲面 上 某 点 的 “ 阴 癌 ”。 








(a) 











图 8.4 平面 法 线 和 曲面 法 线 
(a) 平面 法 线 正 交 于 对 应 平面 上 的 所 有 点  (b) 曲面 法 线 是 垂直 于 曲面 上 某 点 处 切 平 面 的 单 
位 向 量 



















































































对 于 光照 计算 来 说 ， 我 们 需要 通过 三 角形 网 格 曲面 上 每 一 点 处 的 曲 
面 法 线 来 确定 光线 照 到 对 应 点 上 的 角度 。 为 了 求 出 曲面 法 线 ， 我 们 仅 先 
指定 位 于 网 格 项 点 处 的 曲面 法 线 ( 所 以 也 将 之 称 作 顶点 法 线 ，vertex 
normal) 。 接 下 来 ， 为 取得 三 角形 网 格 曲面 上 每 个 点 处 的 近似 曲面 法 
线 ， 在 三 角形 进行 光栅 化 的 过 程 中 对 这 些 顶 点 法 线 进行 插值 计算 (参见 


图 8.5， 并 回顾 5.10.3 节 ) 。 


no 111 


po Pp Phi 


图 8.5 00 与 1 分 别 是 定义 在 线段 端点 Po、P1 处 的 顶点 法 线 。n 是 经 此 线段 端点 向 量 插值 
(加 权 平 均值 》 所 得 到 的 点 P 处 的 法 向 量 。 即 2 = mao 十 女 ml 一 0)， 这 里 的 t 满 足 
p = Po 二 tpP1 一 Po)。 尽管 我 们 出 于 简单 而 仅 介绍 了 线段 的 法 线 插值 ， 但 这 个 方法 
可 以 直接 推广 到 3D 三 角形 的 情景 之 中 





注 意 Note Wp 


我 们 把 对 每 个 像素 逐一 进行 法 线 插值 并 执行 光照 计算 的 方法 称 为 逐 
像素 光照 (per pixel lighting) 或 phong 光 照 模型 (phong lighting) 。 而 
前 文 所 介绍 的 则 是 针对 每 个 顶点 逐一 进行 光照 计算 的 逐 顶 点 光照 (per 
vertex lighting〉 模 型 ， 开 销 虽 低 但 精度 也 低 。 接 下 来 ， 顶 点 着 色 器 将 输 
出 每 个 顶点 光照 的 计算 结果 ， 此 时 再 对 三 角形 中 的 像素 进行 插值 。 将 运 
算 作 业 从 像素 着 色 器 移 至 顶点 着 色 器 是 一 种 常见 的 性 能 优化 手段 。 在 以 
质量 为 重 但 又 允许 结果 存在 少许 视觉 偏差 的 情况 下 ， 这 种 优化 方法 极 具 
吸引 力 。 





8.2.1 计算 法 疝 量 


为 了 找到 三 角形 人 PoP1P2 的 平面 法 线 ， 我 们 首先 计算 位 于 三 角形 边 
上 的 两 个 同 量 : 
uw= Pi Po 
v=p» Po 
那么 ， 此 三 角形 的 平面 法 线 即 为 : 


UXxXU 





7 一 
Iu xow| 


下 列 函 数 将 根据 三 角形 的 3 个 项 点 来 计算 该 三 角形 正面 的 〈 详 见 
5.10.2 作 ) 平面 法 线 : 
XMVECTOR ComputeNormal(FXMVECTOR p6， 
FXMVECTOR p1， 


FXMVECTOR p2) 


XMVECTOR U 
XMVECTOR V 


pl - pe; 
p2 - p6， 


return XMVector3Normalize( 
XMVector3Cross(u,v)); 








对 于 可 微 的 光滑 曲面 而 言 ， 我 们 可 以 利用 微 积 分 方面 的 知识 来 求 出 
曲面 点 处 的 法 线 。 但 问题 在 于 ， 三 角形 网 格 运 用 一 种 被 称 为 求 顶 点 法 线 
平均 值 (vertex normal averaging) 的 计算 方法 。 此 方法 通过 对 网 格 中 共 
享 顶点 zw 的 多 边 形 的 平面 法 线 求 取 平 均值 ， 从 而 获得 网 格 中 任意 顶点 w 处 





的 顶点 法 线 n。 例 如 ， 在 图 8.6 中 ， 网 格 中 的 四 个 多 边 形 共用 顶点 w 
此 ，w 处 的 顶点 法 线 求法 如 下 : 
720 十 221 十 722 十 723 
Tavg = 





mo 十 ml 十 722 十 7223|| 




















图 8.6 ”位 于 中 间 的 顶点 被 四 个 多 边 形 所 共用 ， 所 以 可 通过 计算 这 4 个 多 边 形 平面 法 线 的 
平均 值 来 求 取 中 间 顶 点 处 的 近似 法 线 

















在 上 面 这 个 例子 中 ， 由 于 我 们 对 求 和 的 结果 已 进行 了 规范 化 处 理 ， 
因此 便 无 需 像 往常 求 算术 平均 值 那 样 再 除 以 4。 注 意 ， 为 了 得 到 更 为 精 
准 的 结 有 末 ， 我 们 还 可 以 采用 更 加 复杂 的 求 平 均值 方法 ， 比 如 说 ， 根 据 多 
边 形 的 面积 来 确定 权重 如 面积 大 的 多 边 形 的 权重 要 大 于 面积 小 的 多 边 
形 ) ， 以 求 取 加 权 平 均值 。 








下 列 伪 代码 展示 了 知 给 定 三 角形 网 格 的 顶点 列表 和 索引 列表 ， 该 如 
何 来 求 取 相应 的 法 线 平均 值 。 








// 输入 
// 1. 一 个 顶点 数组 (mVertices) 。 每 个 顶点 都 有 一 个 位 置 分 量 (pos) 和 一 个 法 线 分 量 
(normal) 
// 2. 一 个 索引 数组 (mIndices) 
// 对 于 网 格 中 的 每 个 三 角形 来 说 
for(UINT i = 6; i < mNumTriangles; ++i) 
{ 

// 第 i 个 三 角形 的 索引 

UINT :16 = mIndices[i*3+0]; 

UINT i1 = mIndices[i*3+1]; 

UINT i2 = mIndices[i*3+2]; 








// 第 i 个 三 角形 的 顶点 

Vertex v8 = mVertices[i08]; 
Vertex v1 = mVertices[i1]; 
Vertex v2 = mVertices[i2]; 


// 计算 平面 法 线 

Vector3 e6 = v1.pos - VvV6.pos; 
Vector3 el = v2.pos - VvV6.pos; 
Vector3 faceNormal = Cross(e0, el); 








// 该 三 角形 共享 了 下 面 3 个 顶点 ， 所 以 将 此 平面 法 线 与 这 些 顶 点 法 线 相 加 以 求 平 均值 
mVertices[i8].normal += faceNormal; 
mVertices[i1i].normal += faceNormal; 
mVertices[i2].normal += faceNormal; 


} 


// 对 于 每 个 顶点 v 来 说 ， 由 于 我 们 已 经 对 所 有 共享 顶点 v 的 三 角形 的 平面 法 线 进行 求 和 ， 所 以 
现在 仅 需 进行 。 // 规范 化 处 理 即 可 
for(UINT i = 6; i < mNumVertices; ++i) 






















































































mVertices[i].normal = Normalize(&mVertices[i].normal)); 





8.2.2 ”变换 法 同 量 


思考 图 8.7a。 图 中 ， 切 癌 量 (tangent vector) 二 V1 一 v0 下 交 于 法 问 
量 (normal vector) 只 。 如 果 对 此 应 用 一 个 非 等 比 缩放 变换 4， 则 可 从 图 
8.7b 看 到 ， 变 换 后 的 切 同 量 w4 = v14 一 v04 没 能 与 变换 后 的 法 同 量 nA 
继续 保持 正 交 性 。 


+Y +Y +Y a 
to 六 vo4 nA v04 
a uA uA 
> +X i +X eR 
(b) (0 
图 8.7” 切 向 量 与 法 向 量 的 变换 
(a) 切 向 量 与 法 向 量 在 变换 前 的 正 交 关系 


(b) 经 过 在 Z 轴 正方 向 放大 两 倍 的 处 理 后 ， 法 向 量 不 再 与 切 向 量 保持 正 交 关系 
(c) 通过 对 法 向 量 进行 图 b 中 缩放 变换 的 逆转 置 窍 阵 运算 后 ， 法 向 量 与 切 向 量 重 归 正 交 关 系 





































































































所 以 ， 我 们 现在 所 面 对 的 问题 是 ， 知 给 定 一 个 用 于 变换 点 与 同 量 


(非法 线 ) 的 变换 矩阵 4， 如 何 能 够 求 出 这 样 一 个 变换 矩阵 BB:， 通过 它 
来 变换 法 癌 量 ， 使 经 窃 阵 4 变换 后 的 切 癌 量 与 法 癌 量 重 归 正 交 的 关系 

( 即 w4 .nmnB=0) 。 为 此 ， 我 们 首先 从 已 知 的 信息 着 手 ， 如 果 法 向量 n 
正 交 于 切身 量 w， 则 有 : 




















切 向 量 正 交 于 法 向 量 
将 点 积 改写 为 矩阵 乘法 
插入 单位 矩阵 T= 二 AA 
根据 矩阵 乘法 运算 的 结合 律 

















根据 转 置 矩 阵 的 性 质 (人 4) = 4 
uA -nA 0 根据 转 置 矩阵 的 性 质 (人 4 至) = B A 
和 将 矩阵 乘法 改写 为 点 积 的 形式 














变换 后 的 切身 量 正 交 于 变换 后 的 法 向 量 











因此 ， 通 过 B = (4 ) 〈 矩 阵 4 的 逆转 置 和 矩阵) 对 法 向 量 进行 变换 
后 ， 即 可 使 它 垂直 于 经 矩阵 4 变换 后 的 切 向 量 w4。 





注意 ， 如 果 和 矩阵 4 是 正 交 矩 阵 《〈 即 满足 4 = 4 ) ， 那 么 
B=(A ) =(4) 4。 也 就 是 说 ， 在 这 种 情况 下 我 们 无 需 再 计算 它 的 
逆转 置 定 阵 ， 因 为 利用 正 交 矩阵 4 自 号 即 可 实现 这 一 变换 。 总 而 言 之 ， 
当 我 们 需要 对 经 过 非 等 比 变换 或 剪 切 变换 (shear transformation， 也 有 
译作 切 变 转变 等 ) 后 的 法 同 量 进行 变换 时 ， 则 可 使 用 逆转 置 窍 阵 。 








我 们 在 涉 文件 MathHelper.h 中 为 计算 逆转 置 算 阵 实现 了 一 个 辅助 函 
数 : 


static XMMATRIX InverseTranspose(CXMMATRIX M) 


XMMATRIX A = M; 
A.r[3] = XMVectorSet(6.6f, 60.6f, 6.6f, 1.6f); 


XMVECTOR det = XMMatrixDeterminant(A); 
return XMMatrixTranspose(XMMatrixInverse(&det, A)); 


} 








在 通过 逆转 置 和 矩阵 对 向 量 进行 变换 时 ， 我 们 可 以 将 向 量变 换 和 矩阵 中 
与 平移 操作 有 关 的 项 清 零 ， 而 只 允许 点 类 才 有 平移 变换 。 然 而 ， 从 3.2.1 
节 中 可 知 ，【〔 在 使 用 齐 次 坐标 的 情况 下 ) 将 向 量 的 第 4 个 分 量 设置 为 
w 二 0， 就 可 以 防止 向 量 因 平移 操作 而 受到 影响 。 从 这 个 角度 来 讲 ， 我 
们 便 无 须 为 矩阵 中 的 平移 项 置 零 。 但 问题 在 于 ， 如 果 我 们 希望 连接 逆转 
置 矩 阵 以 及 另 一 个 不 含 非 等 比 缩放 的 矩阵， 如 观察 矩阵 (4 ) V， 那 
么 ， (4 ) 中 经 转 置 后 的 第 4 列 平移 项 将 “渗入 ”最 终 的 乘积 矩阵 ， 从 而 导 
致 错误 的 计算 结果 。 就 此 而 言 ， 我 们 对 和 矩 阵 中 的 平移 项 置 零 是 避免 这 个 
错误 的 预防 措施 。 而 变换 法 线 所 采用 的 正确 公式 实则 为 (4V) ) 。 下 
面 是 一 个 缩放 与 平移 矩阵 的 示例 ， 可 以 看 出 ， 经 过 逆转 置 变换 后 ， 和 拢 阵 
的 第 4 列 并 不 是 [0, 0,0,1]7, 
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注 意 Note 友和 


尽管 运用 了 逆转 置 变 换 ， 但 法 同 量 仍 可 能 会 失去 其 单位 长 度 。 所 以 
在 变换 完成 后 ， 可 能 需 对 它 再 次 进行 规范 化 处 理 。 





8.3 ”参与 光照 计算 的 一 些 天 键 问 量 


在 本 节 中 ， 我 们 要 介绍 一 些 在 光照 计算 中 起 重要 作用 的 向 量 。 如 图 
8.8 所 示 ， 瑟 是 观察 者 的 观察 位 置 ， 我 们 现在 来 考察 : 在 观察 点 PP 处治 着 
时 位 同 量 v 所 定义 的 视线 来 进行 观察 的 过 程 。 位 于 表面 的 点 P 处 有 法 线 n 
， 光 线 由 入 射 方 癌 I 照 射 到 点 也 。 光 癌 量 〈light vector) 工 为 单位 同 量 ， 
其 所 指 方向 与 照射 到 表面 上 点 BP 处 入 射 光 线 工 的 方 癌 刚好 相反 。 尽 管 在 工 
作 中 使 用 光 的 入 射 方向 I 可 能 更 为 直观 ， 但 是 为 了 进行 光照 计算 ， 我 们 
还 是 采用 光 辐 量 五 。 对 于 明 伯 余 弱 定律 〈 详 见 8.4 小 节 ) 而 言 ， 回 量 五 用 
于 计算 工 : = cos9;， 其 中 的 cos9i 是 光 癌 量 L 与 法 向量 n 之 间 的 炎 角 。 反 
射 问 量 r 是 入 射 兴 辐 量 五 关于 表面 法 线 m 的 镜像 。 观 察 辣 量 〈view 
Vector， 或 to-eye vector) v = normalize 五 一 p) 叫 是 从 表面 上 的 点 P 到 观 

察 反方 辐 上 的 单位 癌 量 ， 它 定义 了 由 观察 点 问 表面 点 观察 的 视线 。 我 
们 有 时 还 要 用 到 向 量 -v， 它 是 我 们 所 要 计算 的 由 观察 点 到 表面 点 这 条 光 
线路 径 上 的 时 位 同 量 。 
































反射 向 量 的 定义 为 " = 了 一 2(n :Tjn， 如 图 8.9 所 示 (这 里 假设 n 为 单 
位 癌 量 ) 。 然 而 ， 我 们 在 着 色 器 中 实际 上 是 利用 内 置 函数 reflect 来 计 
算 r 的 。 


em 








示意 图 
光线 的 反射 示 
图 8.9 


u(T. Wz— 


8.4 上 朗 伯 余弦 定律 





我 们 可 以 将 光 看 作 是 光子 的 集合 ， 在 空间 中 按 特 定 的 方向 传播 。 每 
个 光子 都 载 有 《〈《 光 ) 能 量 。 光 源 每 秒 发 出 的 〈 光 ) 能 量 称 为 辐射 通 量 
《radiant flux〉。 而 单位 面积 上 的 辐射 通 量 密度 (irradiance， 称 为 辐 
《 别 ) 照度 ) 是 一 种 很 重要 的 概念 ， 因 为 我 们 将 用 它 来 确定 表面 某 区 域 
所 接收 到 的 光量 〈 即 眼睛 感受 到 的 明 腕 度 ) 。 一 般 来 讲 ， 我 们 可 以 认为 
辐 照 度 是 照射 到 表面 某 区 域 的 光量 ， 或 者 是 通过 空间 中 某 假想 区 域 的 光 
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里 。 

















光线 垂直 照射 到 表面 〈 即 光 辐 量 二 与 法 问 量 ” 相 等 时 ) 的 强度 要 大 
于 以 茶 个 角度 照射 到 表面 的 强度 。 试 想 有 一 小 束 辐射 通 量 为 忆 且 横 截 面 
面积 为 和 4 的 光束 。 如 果 将 此 光束 正 向 垂直 打 向 表面 〈 见 图 8.10a〉， 则 光 
束 照 射 到 表面 上 的 面积 为 4， 而 内 的 辐 照度 为 所 =P/ 抽 。 现 假设 转动 
光源 ， 使 光束 以 茶 个 入 射 角度 照射 到 表面 上 《如 图 8.10b) ， 则 光束 将 
覆 于 表面 上 的 更 大 面积 42。 此 时 ， 该 面积 的 辐 照 度 为 名 = 了 /A42。 根 据 三 
角 学 可 知 ， 刀 及 汪 的 关系 为 : 

















Al ] CoOSsO 
cos6 一 ~ 
-42 A2 Al 
所 以 ， 
p p 
Fo = PR ee = Elicos0= El(n:L) 
A AIl 


换 句 话说 ， 面 积 32 内 的 辐 照 度 就 相当 于 将 受 垂 直方 癌 光 照 的 面积 汪 


zz 


内 的 辐 照 度 按 比 例 n. 工 = cos 8 进行 缩放 。 这 就 是 传说 中 的 表 伯 余弦 定律 
(Lambert’s Cosine Law) 。 考 虑 到 光线 照射 到 表面 另 一 侧 的 情况 〈 此 
时 ， 点 积 的 结果 为 负 值 ) ， 我 们 用 max 函 数 来 钳制 器“ 缩放 因子 ”的 取 值 
范围 : 


f(0) = maxlcos0, 0) = maxlL:n., 0) 


图 8.11 所 示 的 是 函数 1(9) 的 图 像 。 观 察 可 知 ， 随 着 变量 9 的 变化 ， 
数 的 值 域 范 围 为 0.0 一 1.0〈 即 光照 强度 的 变化 范围 为 0% 一 1009%) 。 


(a) (b) 


图 8.10 ”照射 方向 的 对 比 
(a) 横 截 面 面 积 为 :41 的 光束 垂直 照射 到 表面 (b) 将 横 截 面 面 积 为 -4 的 光束 以 某 角度 
照射 到 表面 上 的 最 大 面积 为 442， 因 此 等 量 光 能 将 扩散 到 更 大 的 面积 上 ， 
继而 导致 照射 到 物体 表面 的 光束 看 起 来 “ 偏 暗 ” 





















































强度 








f(8)= max(cos 8,0) | 


+0 











-0.1 上 1 1 | 1 1 1 
地 8 民 到 
图 8.11 在 范围 ~2 < 9 < 2 内 ， 函数 /(9) = maxlcos9, 0) = max( 上 Ln, 0) 的 图 像 。 注 


8.5 漫 反 射 光 照 


考虑 图 8.12 所 示 的 不 透明 物体 的 表面 。 ee 
点 时 ， 一 部 分 光 会 进入 物体 的 内 部 ， 并 与 表面 附近 的 物质 相互 作用 。 
些 光 会 在 物体 内 部 四 处 反弹 ， 其 中 一 部 分 会 被 吸收 ， 而 余下 部 分 则 会 回 
各 个 方 癌 散射 并 返回 表面 ， 这 即 是 所 谓 的 漫 反 遇 (diffuse reflection ) 。 
为 了 方便 ， 我 们 假设 光 在 入 射 点 处 发 生 散 射 。 光 的 吸收 和 散射 程度 与 物 
体 的 材质 密切 相关 ， 例 如 ， 木 材 、 泥 土 、 砖 块 、 瓦 片 与 灰 泥 所 吸收 与 散 
射 的 光量 是 不 同 的 〈 这 也 正 是 为 什么 不 同 材质 看 起 来 各 不 相同 的 原 
因 ) 。 在 所 用 的 这 种 光照 与 材质 交互 的 近似 模型 之 中 ， 我 们 规定 光线 会 
在 表面 的 所 有 方向 上 均匀 散射 ， 因 此 ， 无 论 在 哪个 观察 点 《眼睛 观看 的 
位 置 ) 进行 观察 ， 反 射 光 都 会 进入 观察 者 的 眼中 。 上 所以， 我 们 无 须 考虑 

察 点 的 具体 位 置 ( 即 漫 反射 光照 的 计算 与 观察 点 无 关 ) ， 而 表面 点 上 
oa 点 上 看 来 也 都 是 相同 的 。 
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图 8.12” 当 入 射 光 照射 到 一 个 漫 反射 面 时 便 会 向 各 个 方向 均匀 散射 。 光 线 进 入 介质 的 内 部 后 ， 
便 会 在 其 表面 下 发 生 散 射 。 一 部 分 光 将 被 物体 吸收 ， 而 剩余 部 分 则 会 散射 回 物体 的 表面 。 由 于 
表面 下 的 散射 模型 过 于 复杂 ， 我 们 便 假 设 光 在 入 射 点 处 均匀 的 散射 问 表 面 外 的 各 个 方向 


























我 们 将 漫 反 射 光 照 的 计算 分 为 两 个 部 分 。 在 第 一 部 分 中 ， 我 们 要 指 


定 光 照 颜 色 以 及 漫 反 射 反 照 率 (diffuse albedo) 颜色 。 漫 反射 反照 率 表 
示 的 是 根据 表面 的 漫 反射 挛 〈diffuse reflectance， 也 译作 漫 反 射 比 ) 而 
被 反射 的 入 射 光 量 〈 根 据 能 量 守恒 定律 ， 入 射 光 不 是 被 反射 回 表 面 就 是 
被 材质 吸收 了 ) 司 。 要 对 它们 进行 处 理 就 需 用 分 量 式 颜 色 乘 法 〈 因 为 光 
是 具有 颜色 的 ) 。 例 如 ， 假 设 表面 上 一 点 会 反射 50% 的 入 射 红 光 、100%6 
的 绿 光 以 及 75% 的 星光 ， 如 果 这 时 有 一 束 强度 为 80% 的 白光 获 来 ， 那 么 
此 入 射 光 的 量 值 就 可 以 表示 为 Br = (0.3,0.8,0.8)， 又 因为 漫 反 射 反 照 率 
为 mia 二 (0,5,1.0,0.75)， 所 以 此 点 的 反射 光量 为 : 














= Br ® my = (0.8. 0.8. 0.8) ® (0.5., 1.0. 0.75) = (0.4. 0.8. 0.6) 


可 以 发 现 ， 漫 反射 反照 率 分 量 的 取 值 范围 必定 在 0.0 一 1.0 之 间 ， 因 
此 我 们 用 小 数 来 表示 反射 光 。 


然而 ， 上 述 公 式 并 非 十 分 准确 ， 我 们 还 需 将 衣 伯 余弦 定律 〈 根 据 表 
面 法 线 与 光 同 量 之 间 的 夹 角 来 控制 表面 接收 原始 光照 的 量 ) 考虑 在 内 。 
设 妃 rz 表示 入 射 光 量 ， 痉 上 为 漫 反射 反照 率 ， 瑟 为 光 回 量 ， 而 台 为 表面 法 
线 ， 则 位 于 表面 上 某 点 处 的 漫 反 射 光 量 为 : 














cd = max(L:n.0).: BL® md (8.1) 


8.6 ”环境 光照 


如 前 文 押 述 ， 我 们 的 光照 模型 并 没有 考虑 到 场景 中 其 他 物体 反射 来 
的 间接 光照 。 事 实 上 ， 我 们 在 真实 世界 中 所 看 到 的 多 是 间接 区。 例如 ， 
屋内 的 光源 并 没有 路 径 可 以 直接 照 入 连接 房间 的 走 历 ， 但 是 光线 经 过 室 
内 墙壁 的 反射 并 射 入 走 友 ， 使 尼 有 了 些许 光亮 。 再 来 看 另 一 个 示例 ， 假 
设 我 们 正 坐 在 一 间 设 有 一 个 光源 的 屋子 里 ， 房 内 的 桌 上 还 放 有 一 个 双 
吉 。 虽 然 杂 过 只 有 一 侧 被 光源 直接 照射 ， 但 它 的 另 一 侧 却 不 可 能 完全 被 
笼 单 在 漆黑 的 阴影 当中 。 这 是 因为 一 部 分 光 经 墙壁 或 室内 的 其 他 物体 反 
味 ， 而 最 终 照 射 到 茶 赤 的 背面 。 











为 了 处 理 这 种 间接 光照 ， 我 们 给 光照 方程 引进 了 一 个 环 声 光 
(ambient light) 项 : 


ca = AL®% md (8.2) 


颜色 4z 指 定 了 表面 收 到 的 间接 〈 环 境 ) 光量 ， 它 可 能 与 光源 发 出 
的 光量 不 同 ， 因 为 光源 发 射 的 光 在 其 他 表面 反射 的 时 候 会 被 吸收 一 部 
分 。 漫 反射 反照 率 mma 指 示 了 根据 表 面 温 反射 率 而 航 表 面 反 射 的 入 射 兴 
量 。 同 时 ， 我 们 也 借用 此 值 来 表明 被 表面 反射 的 入 射 环境 光量 。 也 台 是 
说 ， 对 于 环境 光照 而 言 ， 我 们 其 实 是 在 围绕 间接 环境 ) 光照 的 漫 反 射 
率 进 行 建 模 。 所 有 的 环境 光 都 是 以 统一 的 亮度 将 物体 稍稍 照 亮 一 一 而 完 
全 没有 按 真实 的 物理 效果 进行 计算 。 这 个 模型 的 总 体 思 路 是 : 间接 光照 
在 场景 中 会 发 生 多 次 的 散射 与 反射 ， 并 会 在 所 有 方 癌 上 均等 的 射 癌 目标 








物体 。 


8.7 ”镜面 光照 


我 们 此 前 用 漫 反 射 光 照 来 模拟 漫 反射 的 过 程 : 光 进 入 介质 ， 发 生 反 
射 ， 部 分 光 被 吸收 ， 而 剩 下 的 光 则 向 介质 外 的 各 个 方向 散射 。 第 二 种 反 
射 的 发 生 是 根据 一 种 名 为 菲 涅 耳 效 应 〈EFresnel effect， 也 译作 菲 涅 尔 效 
应 ) 的 物理 现象 。 当 光线 到 达 两 种 不 同 折射 弯 〈index of refraction) 介 
质 之 间 的 界面 时 ， 一 部 分 光 将 被 反射 ， 而 剩 下 的 光 则 发 生 折 瑞 
(refract) ， 这 个 过 程 可 参考 图 8.13。 折 射 率 是 一 种 介质 的 物理 性 质 ， 
即 光 在 真空 中 传播 的 速度 与 光 在 给 定 介质 内 的 传播 速度 之 比 。 我 们 将 第 
二 种 光 的 反射 过 程 称 为 镜面 反射 (specular reflection) ， 把 被 反射 的 光 
称 为 镜面 〈 反 射 ) 光 〈specular light) ， 如 图 8.14a 所 示 。 











图 8.13 ”镜面 光照 








(a) 具有 法 线 妈 的 完全 光滑 平整 的 镜面 〈《 即 理想 镜面 ) 所 呈现 的 菲 涅 耳 效 应 。 入 射 光 了 抵达 表 

面 后 分 为 两 个 部 分 进行 传播 ， 一 部 分 按 反 射 方向 F 发 生 反射 ， 剩 余部 分 则 以 折射 方向 码 [ 射 入 介 

质 。 所 有 这 些 向 量 都 位 于 同一 平面 内 。 反 射 向 量 7 与 法 线 几 之 间 的 夹 角 总 保持 为 9i， 而 且 光 向 量 

五 二 一 了 与 法 线 n 之 间 的 夹 角 也 同 为 9i。 至 于 折射 向 量 t 与 -nt 之 间 的 夹 角 9t， 则 取决 于 两 种 介 

质 间 的 折射 率 以 及 斯 涅 尔 折射 定律 (SnellsLaw) ”(b) 事实 上 ， 大 多 数 的 物体 并 不 是 完全 光 

滑 平 整 的 理想 镜面 ， 而 是 在 微观 上 具有 一 定 的 粗糙 度 。 这 就 导致 了 反射 光 与 折射 光 分 别 关 于 反 
射 向 量 与 折射 向 量 产生 一 些 扩散 















































图 8.14 粗糙 表面 的 镜面 光照 
(a) 粗糙 表面 的 镜面 光 会 在 癌 量 的 附近 发 生 些许 扩散 
(b) 射 入 观察 者 眼中 的 反射 光 实 为 镜面 反射 和 漫 反 射 的 组 合 效果 





如 果 折射 光 沿 折射 回 量 从 介质 的 另 一 侧 射出 ， 并 进入 观察 者 的 眼 
中 ， 则 该 物体 看 起 来 就 像 是 透明 的 。 即 光 通 过 了 透明 的 物体 。 在 实时 的 
图 像 处 理 中 ， 一 般 用 alpha 混 合 拉 术 或 后 期 处 理 特效 来 模拟 透明 对 象 的 折 
财 过 程 ， 有 关内 容 在 本 书后 面 会 有 相应 的 讲解 。 现 在 ， 我 们 只 考虑 不 透 
明 的 物体 。 





对 于 不 透明 物体 而 言 ， 折 射 光 进入 介质 并 根据 漫 反 射 率 发 生 漫 反 
射 。 所 以 通过 对 图 8.14b 中 不 透明 物体 的 观察 可 以 看 出 ， 从 表面 反射 和 
进入 眼睛 的 光量 是 由 物体 的 〈 漫 ) 反射 光 和 镜面 光 所 构成 的 。 与 漫 反 射 
光 相 比 ， 镜 面 光 可 能 并 不 会 射 入 观察 者 的 眼 内 ， 因 为 其 反射 只 发 生 在 某 
一 特定 角度 。 也 就 是 说 ， 镜 面 光 照 的 计算 与 观察 点 有 关 。 同 时 ， 这 惑 意 
味 着 随 着 观察 位 置 在 场景 中 的 移动 ， 它 所 收 到 的 镜面 光量 也 将 随 之 发 生 
改变 。 








8.7.1 菲 涅 耳 效 应 


我 们 来 考虑 一 个 具有 法 线 m 的 平滑 界面 ， 它 将 两 种 不 同 折射 率 的 介 
质 分 隔 开 来 。 由 于 在 界面 处 具有 折射 率 不 连续 性 《〈 因 不 同 介质 的 折射 率 





差异 所 导致 ); ， 当 光线 照射 到 界面 时 ， 一 部 分 会 被 界面 反射 ， 另 一 部 分 
则 折射 进 界 面 〈 见 图 8.13) 。 菲 涅 耳 方 程 〈Fresnel equations ) ed 
法 描述 了 入 射 光线 被 反射 的 百分比 ， 即 0 < Rr < 1。 根 据 能 量 守 恒定 
律 ， 如 果 有 RF 是 反射 光量 ， 则 (1 一 琅 #) 为 折射 光量 。RF 的 值 是 一 个 RGB 癌 
量 ， 因 为 光 的 颜色 反映 了 反射 光量 。 











反射 的 光量 既 依 赖 于 介质 《〈《 某 些 材质 的 反射 率 相 对 更 大 ) ， 也 与 法 
问 量 m 与 光 同 量 二 之 间 的 夹 角 & 有 关 。 由 于 光照 过 程 的 复杂 性 ， 我 们 一 般 
不 会 将 完整 的 菲 涅 耳 方 程 用 于 实时 泻 染 ， 而 是 采用 石 里 元 近似 (Schlick 
approximation〉 法 来 加 以 代 蔡 : 














Rr(0;) = RF(0")+ (1 — Rr(0))(l ~— cosO; )” 


Rr(0 是 介质 的 一 种 属性 ， 下 面 所 列 的 即 是 一 些 和 常见 材质 的 对 应 属 
性 数值 [M6ller08]。 


ee 




















外 (0.95, 0.93, 0.88) 


ee 加 a 


图 8.15 所 示 的 是 3 种 具有 不 同 荆 rl ) 属 性 值 材质 的 石 里 克 近 似 曲 线 














图 。 此 图 的 观察 要 点 在 于 反射 光量 随 着 9; 一 90 增加 而 递增 的 过 程 。 我 
们 来 看 一 个 现实 世界 中 的 例子 ， 思 考 图 8.16， 现 假设 我 们 正 置 喘 于 一 个 
水 质 相 对 清澈 、 深 达 数 瑞 尺 的 小 池塘 里 。 寿 同 下 俯视 ， 我 们 基本 可 以 清 
楚 地 看 到 其 底部 沉积 的 沙 石 。 这 是 由 于 有 从 周围 环境 中 照射 到 池水 的 光 
以 接近 于 0.0?" 的 小 角度 4 反射 进 我 们 的 眼 上 而 造成 的 ， 如 此 一 来 ， 反 射 到 
我 们 眼中 的 光量 相对 较 低 ， 又 根据 能 量 守恒 定律 可 知 ， 此 时 的 折射 光量 
却 很 高 。 现 在 来 换个 观察 角度 ， 如 有 果 我 们 问 稍 远 处 望 去 ， 将 会 看 到 池水 
极 强 的 反射 兴 。 这 是 因为 有 从 周围 环境 中 射 问 水 的 光 以 接近 90.0? 的 角度 
4 反射 进 我 们 的 眼中 ， 从 而 增加 了 反射 光量 。 这 种 现象 通 冲 称 为 非 涅 耳 
效应 (Fresnel effect) 。 可 以 将 菲 涅 耳 效应 简洁 地 概括 为 : 反射 光量 取 
决 于 材质 (RF(0 )) 以 及 法 线 与 光 同 量 之 间 的 夹 角 。 


Rb) 
































图 8.15 水、 红宝石 、 铁 3 种 不 同 材质 的 石 里 克 近 似 曲 线 图 





(a) (b) 


图 8.16 ” 池 面 的 反射 与 折射 
(a) 俯视 池 底 的 时 候 ， 由 于 光 向 量 瑟 与 法 线 妈 之 间 的 夹 角 极 小 ， 因 此 反射 光量 低 而 折射 光量 
高 


(b) 从 远 处 向 池水 脐 望 时 ， 因 为 光 向 量 五 与 法 线 有 2 之 间 的 夹 角 过 大 ， 从 而 导致 反射 光量 高 而 折 
射 光 量 低 











金属 会 吸收 透射 光 (transmitted light) [Maller08]， 这 意味 着 它们 不 
具有 本 体 反 射 率 (body reflectance， 也 有 译作 体 反 射 ， 或 体 漫 反射 
ee 但 金属 并 不 会 看 上 去 表现 为 纯 黑色 ， 因 为 它们 的 

F(0 ) 值 较 高 ， 也 就 是 说 ， 就 算是 在 接近 于 0" 这 样 的 极 小 入 射 角度 上 ， 
它们 也 能 反射 可 观 的 镜面 光量 。 





8.7.2 ”表面 粗糙 度 

真实 世界 中 的 反射 物体 往往 不 是 理想 镜面 (perfect mirror) 。 尺 管 
一 个 物体 的 表面 看 起 来 似乎 十 分 平滑 ， 但 从 微观 水 平 上 看 ， 它 还 是 具有 
一 定 的 粗糙 度 (roughness) 。 如 图 8.17 所 示 ， 我 们 可 以 认为 理想 镜面 的 
粗糙 度 为 0， 它 的 微观 表面 法 线 (micro-normal， 或 作 微 表 面 法 线 ) 都 与 
宏观 表面 法 线 (macro-normal， 或 作 宏 表 面 法 线 ) 的 方向 相同 。 随 着 粒 
糖度 的 增加 ， 人 微观 表面 法 线 的 方 加 开始 纷纷 偏离 宏观 表面 法 线 ， 由 此 反 








射 光 逐渐 扩展 为 一 个 镜面 锥 (specular lobe) 。 
五 
宏观 表面 法 线 a 
微观 表面 法 线 | 





(a) 








图 8.17 ”图 a 中 ， 黑 色 的 水 平 线条 表示 被 放大 的 小 面 元 〈small surface element) 。 从 微观 角度 来 
看 ， 由 于 在 此 层级 的 表面 上 具有 一 定 的 粗糙 度 ， 因 此 许多 微观 表面 法 线 各 指向 不 同 的 方向 。 若 
表面 愈 平滑 ， 便 会 有 更 多 的 微观 表面 法 线 愈 发 平行 于 宏观 表面 法 线 ， 而 表面 越 粗糙 ， 则 会 有 更 
多 的 微观 表面 法 线 越发 偏离 于 宏观 表面 法 线 。 图 b 中 ， 粗 糙 度 令 镜面 反射 光 扩 散 开 来 ， 镜 面 反 射 
光 的 范围 称 为 镜面 汶 。 一 般 来 讲 ， 镜 面 流 的 形状 将 根据 建 模 所 用 的 表面 材质 种 类 而 各 不 相同 
















































































为 了 用 数学 方法 对 粗糙 度 进 行 建 模 ， 我 们 采用 了 微 平 面 
Cmicrofacet， 也 作 微 表面 ) 模型 。 在 此 模型 中 ， 我 们 将 微观 表面 模拟 
为 由 多 个 既 微小 又 平滑 的 微 平面 所 构成 的 集合 而 微观 表面 法 线 正 是 这 
些微 平面 上 的 法 线 。 针 对 指定 的 观察 单位 辣 量 v 以 及 光 同 量 L， 我 们 需要 

了 解 由 LIL 同 v 反 射 的 所 有 人 微 平面 片段 的 分 布 情况 ， 换 言 之 ， 即 法 线 为 

h = normalize(L + vw) 这 种 微 平面 片段 在 所 有 微 平面 中 所 占 比 例 ， 如 图 
8.18 所 示 。 这 样 一 来 ， 融 可 以 确定 有 多 少 光 通过 镜面 反射 的 方式 ， 以 此 
路 径 进 入 到 观察 者 的 眼中 一 一 发 生 由 瑟 到 uv 反射 过 程 的 微 平 面 越 多 ， 则 观 
察 者 在 此 角度 上 看 到 的 镜面 光 越 明亮 。 


sm 
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图 8.18 ”以 丸 为 法 线 ， 光 从 二 反射 至 如 的 微 平 面 


























由 于 癌 量 六 位 列 向 量 五 与 向 量 v 间 的 中 间 位 置 ， 故 称 之 为 中 间 同 量 
(halfway vector， 也 有 译作 中 途 同 量 、 半 和 角 问 量 等 ) 。 此 外 ， 还 要 再 引 
进 一 个 中 间 同 量 h 与 宏观 表面 法 线 n 之 间 的 夹 角 90。 

















我 们 定义 归 一 化 分 布 函 数 \9n) & 10, J， 用 来 表示 微观 表面 法 线 h 与 
宏观 表面 法 线 n 之 间 夹 角 为 91 的 微 平面 的 分 布 情况 。 从 直观 上 来 讲 ， 我 
们 希望 浮 数 P\9wy 在 9n =0 时 取得 最 大 值 。 也 就 是 说 ， 我 们 希望 微 平面 法 
线 都 平行 于 宏观 表面 法 线 。 并 盼望 随 厦 9 的 增加 〈 即 渐渐 仿 离 于 宏观 表 
面 法 线 的 微观 表面 法 线 h〉 ， 这 些 以 同 量 h 为 法 线 的 微 平面 片段 逐渐 减 
少 。 用 来 模拟 以 上 讨论 中 期 望 模型 .9 的 一 种 较 流行 的 可 控 函 数 为 : 














p(On) = cos™ (4) 
= cos™"(n:.h) 

注意 到 ， 为 了 求 出 coste = (nh) 束 需要 知道 式 中 这 两 种 疝 量 。 图 
8.19 展 示 了 对 于 取 不 同 mm 值 时 函数 P(91) = cos (64 的 图 像 。 其 中 ， 变 量 m 
控制 的 是 粗糙 度 ， 它 指定 了 所 有 以 微观 表面 法 线 h 与 宏观 表面 法 线 n 之 
间 夹 角 为 91 的 微 平面 片段 的 分 布 情况 (所 占 比 例 ) 。 随 着 mm 的 减 小 ， 表 
面 变 得 更 加 粗糙 ， 而 微 平 面 的 法 线 也 都 愈加 偏离 宏观 表面 法 线 。 随 着 m 
的 增 大 ， 表 面 变 得 更 加 光滑 ， 微 平面 法 线 也 都 越发 趋 于 宏观 表面 法 线 。 
















cos16(6) ) 


cose4(0,) 





cos!23(0; ) 





On 




















图 8.19 一 种 针对 粗粮 度 进行 建 模 的 函数 曲线 图 

















我 们 可 以 将 plenj 与 某 种 归 一 化 因子 进行 组 合 ， 从 而 获得 基于 粗糙 度 
来 模拟 镜像 反射 光量 的 新 函数 : 


SA On ) 一 








图 8.20 展 示 了 此 函数 根据 不 同 取 值 的 变量 m 所 得 到 的 图 像 。 与 之 前 
一 样 ， 变 量 普 依然 控制 着 粗糙 度 ， 但 是 我 们 还 为 之 加 上 了 归 一 化 因子 


十 3 


8 ， 以 使 光 能 守恒 。 该 归 一 化 因子 实际 上 支配 着 图 8.20 中 曲线 的 高 

度 ， 因 此 随 着 变量 m 的 变化 使 镜面 办 变 宽 或 变 罕 ， 令 光 能 整体 达到 守 

恒 。 对 于 较 小 的 mn 值 来 说 ， 表 面 会 更 加 粗糙 ， 并 且 镜 面 锥 变 冤 ， 继 而 促 
使 光 能 散播 得 更 三 。 因 此 ， 我 们 预计 镜面 高 光 (specular highlight， 即 镜 
面 光 ) 会 变 暗 ， 因 为 其 能 量 已 经 被 广泛 播 散 出 去 了 。 男 一 方面 ， 对 于 较 
大 的 m 值 而 言 ， 表 面 会 更 加 平 消 ， 而 镜面 办 会 变 得 更 罕 。 因 此 ， 我 们 预 
计 镜 面 高 光 会 更 郭 ， 因 为 其 能 量 更 为 集中 。 从 几何 角度 上 来 看 ， 变 量 m 





























控制 者 镜面 多 的 扩散 程度 。 如 果 要 模拟 光滑 的 表面 (例如 被 抛光 的 金 
属 ) 就 使 用 较 大 的 mm 值 ， 而 针对 更 粗糙 的 表面 而 言 ， 则 使 用 较 小 的 m 
值 。 


我 们 把 菲 涅 耳 反 射 以 及 表面 粗糙 度 这 两 个 公式 的 组 合 来 作为 这 一 布 
的 尾声 。 首先 尝 试 计 算 在 观察 方 同 w 上 所 反射 的 光量 〈 见 图 8.18) 。 回 
顾 以 六 为 法 线 ， 且 反射 光 沿 观察 问 量 w 传 播 的 微 平 面 。 设 o% 为 光 同 量 w 与 
中 间 向 量 k 之 间 的 夹 角 ， 那 么 ， 根 据 菲 涅 耳 效 应 所 言 ，RF tanJ 反 映 了 关 
于 PR 射 入 v 的 反射 光量 。 又 由 于 表面 的 粗糙 度 为 "\&2)， 所 以 我 们 还 要 将 
反射 光量 Er (onJ 乘 以 粗 糖度。 由 此 ， 我 们 便 可 得 到 镜面 反射 光量 : 设 
(max(L.n, 0). Bi) 表示 入 射 光照 到 表面 上 一 点 的 光量 ， 而 根据 粗糙 度 与 
里 耳 效 应 ，(maxlL.n, 0). Bi) 这 一 段 镜 面 反射 到 观察 者 眼中 的 实际 光 




















非 
量 为 : 


Ss h)™ 





c= max(L:n.0): Br®%Rerl(a 和 
| (8.3) 


可 以 发 现 ， 如 果 L.n < 0， 那么 所 计算 的 结果 是 射 癌 表面 为 一 侧 的 
光 ， 因 而 此 时 的 正 表面 并 不 会 接收 到 任何 光照 。 







十 8 
8 coS64(6)) 








十 8 
cos16(05) 








图 8.20 ”一 种 根据 粗糙 度 来 对 镜面 反射 光 进 行 建 模 的 函数 图 像 


8.8 ”光照 模型 的 概述 





现在 将 之 前 所 述 的 所 有 交 照 内 容 都 结合 起 来 ， 即 表面 反射 的 光量 相 
当 于 环境 反射 光 、 漫 反射 光 以 及 镜面 反射 沧 的 光量 总 和 。 


1. 环境 光 co: 模拟 经 表面 反射 的 间接 光量 。 








2. 温 反 射 光 ca: 对 进入 介质 内 部 ， 又 经 过 表面 下 吸收 而 最 终 散 射 
出 表面 的 光 进 行 模拟 。 由 于 对 表面 下 的 散射 光 建 模 比 较 困 难 ， 我 们 便 假 
设 在 表面 下 与 介质 相互 作用 后 的 光 从 进入 表面 处 返回 ， 并 同 各 个 方 回 均 
匀 散 射 。 


3. 镜面 光 c*: 模拟 经 菲 涅 耳 效应 与 表面 粗糙 度 共 同 作用 的 表面 反 
冉 光 。 


据 此 来 推导 出 我 们 在 本 书 的 着 色 需 中 实现 的 光照 方程 : 


LitColor = ca 十 cd 十 cs 





= AL ma+max(L:.n.0).BL& (™ + Rr (an) 一 ~ 人 : mn") 
(8.4) 
设 式 (8.4) 中 的 所 有 向 量 均 为 单位 长 度 。 
1. 王 : 指向 光源 的 光 同 量 。 


2. n: 表面 法 线 。 








3. h: 列 于 光 向 量 与 观察 向 量 〈 由 表面 点 指向 观察 点 的 单位 向 量 ) 
之 间 的 中 间 向 量 。 


4. ALr: 表示 入 射 的 环境 光量 。 


5. BL: 表示 入 射 的 直射 光量 。 





6. ma: 指示 根据 表 面 温 反射 率 而 反射 的 入 射 光 量 。 


7. 工 -n: 衣 伯 余弦 定律 。 








8. an: 中 间 癌 量 h 与 光 向 量 L 之 间 的 夹 角 。 








9. Rr lan): 根据 菲 涅 耳 效应 ， 关 于 中 间 回 量 中 所 反射 到 观察 者 眼 
中 的 光量 。 

10. m: 控制 表面 的 粗糙 度 。 

11. (mA : 指定 法 线 h 与 宏观 表面 法 线 n 之 间 夹 角 为 94 的 所 有 微 
平面 片段 的 分 布 情况 (所 占 比例 〉。 


mn 十 8 


12. 8 : 在 镜面 反射 过 程 中 ， 为 模拟 能 量 守恒 所 采用 的 归 一 化 
因子 。 


图 8.21 展 示 了 这 3 种 分 量 协 同 工 作 的 效果 。 





图 8.21 图 a 中 ， 仅 采用 环境 光 的 球体 着 色 效果 ， 可 以 看 出 环境 光 以 均匀 的 亮度 照射 着 球体 。 图 

pb 中， 环境 光 与 漫 反射 光 组 合 的 光照 效果 。 现 在 就 可 以 观察 到 根据 朗 伯 余 弱 定律 所 呈现 出 的 由 明 

到 瞳 的 平滑 渐变 。 图 c 中 ， 环 境 光 、 漫 反射 光 以 及 镜面 光 所 组 合 而 成 的 最 终 光 照 效 果 。 显 而 易 
见 ， 镜 面 光照 表现 出 了 镜面 高 光 。 


注 意 Note ~ 


式 〈8.4) 是 一 种 通用 而 又 流 行 的 光照 方程 ， 即 便 如 此 ， 它 也 仅 是 
多 种 光照 模型 的 其 中 之 一 而 已 。 为 有 一 些 其 他 的 光照 模型 ， 也 值得 读者 
前 去 探索 一 看。 





8.9 ”材质 的 实现 





我 们 所 编写 的 材质 结构 体 定 义 在 d3dUtilh 文 件 中 ， 部 分 代码 如 下 : 














// 在 我 们 的 演示 程序 中 表示 材质 的 简单 结构 体 
struct Material 


{ 


























// 便于 查找 材质 的 唯一 对 应 名 称 


std::string Name; 








// 本 材质 的 常量 缓冲 区 索引 
int MatCBIndex = -1; 





























// 漫 反 射 纹理 在 SRV 堆 中 的 索引 。 在 第 9 章 纹理 贴图 时 会 用 到 
int DiffuseSrvHeapIndex = -1; 


























// 已 更 新 标志 〈dirty flag， 也 作 脏 标志 ) 表示 本 材质 已 有 变动 ， 而 我 们 也 就 需要 更 新 





常量 缓冲 区 了 。 

// 由 于 每 个 帧 资源 FrameResource 都 有 一 个 材质 常量 缓冲 区 ， 所 以 必须 对 每 个 FrameReso 
urce 都 进 

// 行 更 新 。 因 此 ， 当 修改 某 个 材质 时 ， 应 当 设置 NumFramesDirty = gNumFrameResourc 
es， 以 使 每 

// 个 帧 资源 都 能 得 到 更 新 

int NumFramesDirty = gNumFrameResources; 






































// 用 于 着 色 的 材质 常量 缓冲 区 数据 
DirectX: :XMFLOAT4 DiffuseAlbedo = { 1.6f, 1.6f, 1.6f, 1.6f }; 
DirectX: :XMFLOAT3 FresnelR6 = { 86.61f, 60.61f, 8.61f }; 

float Roughness = 0.25f; 

DirectX: :XMFLOAT4X4 MatTransform = MathHelper::Identity4x4(); 








为 了 模拟 真实 世界 中 的 材质 ， 需 要 设置 DiffuseAlbedo( 漫 反射 反 
照 率 ) 与 FresnelR@( 材 质 属性 Rr(0 )) 这 对 与 真实 度 相关 的 数值 组 
合 ， 再 辅 以 一 些 关 平 艺术 性 的 细节 调整 。 例 如 ， 金 属 导体 吸收 了 进入 金 
属 内 部 的 折射 光 [M6ller08]， 这 就 意味 着 ， 金 属 材质 将 不 会 发 生 漫 反 射 

《 即 DiffuseAlbedo 的 值 为 0) 。 然 而 ， 我 们 是 不 会 100% 按 物理 学 上 的 


光照 理论 来 建 模 的 ， 而 是 稍 作 调整 。 一 种 语 有 艺术 性 的 更 佳 策略 是 
为 DiffuseAlbedo 设 定 一 个 非 0 的 较 小 值 。 这 一 切取 侈 的 关键 点 在 于 我 
们 既 应 当 冬 试 使 用 物理 上 接近 现实 的 材质 数值 ， 也 应 该 为 艺术 性 留 下 一 
些 空 间 ， 使 之 对 数值 适当 调整 ， 以 展现 出 更 佳 的 视 党 效果 。 


在 我 们 所 用 的 材质 络 构 体 中 ， 将 粗糙 度 指定 在 归 一 化 的 译 点 值 范 
[0, 1 入。 粗糙 度 为 0 表示 理想 的 光 请 表面 ， 粗 糙 度 为 1 则 表示 实际 能 达到 
的 最 粗糙 的 表面 。 归 一 化 范围 使 得 不 同 材质 之 间 粗 糙 度 的 比较 更 加 方 
便 。 例 如 ， 粗 糙 度 为 0.6 的 材质 比 粗 糙 度 为 0.3 的 材质 要 加 倍 粗糙 。 在 着 
色 需 代码 中 ， 我 们 将 利用 粗糙 度 来 推导 式 〈8.4) 中 所 用 的 指数 四。 根据 
我 们 对 粗糙 度 的 定义 可 以 有 发现 ， 表 面 的 光 译 度 〈shininess， 亦 有 译作 反 
光度 等 ) 是 与 粗糙 度 相反 的 属性 ，shininess = 1 一 roughness € [0, 十 。 





现在 ， 摆 在 我 们 眼前 的 当务之急 是 该 按照 什么 粒度 〈granularity ) 
来 指定 材质 的 数据 。 材 质 的 具体 数值 可 能 会 随 着 表面 而 发 生 改变 ， 即 同 
一 表面 上 不 同 点 处 的 材质 数据 可 能 各 不 相同 。 例 如 ， 考 虑 图 8.22 所 示 的 
一 辆 汽车 模型 ， 其 中 的 车 刁 、 车 窗 、 车 灯 以 及 轮胎 所 反射 和 吸收 的 光量 
都 是 不 同 的 ， 由 此 材质 数值 将 随 着 汽车 表面 的 位 置 而 产生 变化 。 








实现 这 种 变化 的 解决 方案 之 一 是 以 每 个 顶点 为 基准 来 指定 材质 的 具 
体 数 值 。 在 三 角形 的 光栅 化 处 理 期 间 ， 会 对 这 些 顶 点 中 的 材质 属性 进行 
插值 计算 ， 以 求 出 三 角形 网 格 表 面 上 每 一 点 的 材质 数值 。 可 是 ， 就 如 我 
们 在 第 7 章 的 “Land and Waves”( 陆 地 与 波浪 ) 演示 程序 中 所 见 到 的 ， 逐 
顶点 的 颜色 依然 很 “粗糙 ?>， 以 致 不 能 通 真 地 模拟 出 较为 丰富 的 细节 。 除 
此 之 外 ， 为 了 绘制 每 个 顶点 的 颜色 还 要 问 顶 点 结构 体 中 添加 额外 的 数 








据 ， 同 时 ， 还 需要 采用 不 同 的 工具 来 绘制 这 些 顶 点 颜色 。 事 实 上 ， 更 普 
思 的 解决 方法 是 有 来 用 纹理 贴图 。 不 过 ， 这 是 第 9 和 章 的 主题 。 对 于 本 章 来 
说 ， 我 们 在 绘制 调用 时 允许 对 材质 进行 频繁 地 更 改 。 因 此 ， 我 们 为 每 种 
材质 定义 了 唯一 的 属性 ， 并 将 它们 列 于 一 个 表 中 : 





std: :unordered map<std::string, std::unique ptr<Material>> mMaterials; 


void LitWavesApp: :BuildMaterials() 

{ 
auto grass = std::make unique<Material>(); 
grass->Name = "grass"; 
grass->MatCBIndex = 0; 
grass->DiffuseAlbedo = XMFLOAT4(06.2f, 8.6f, 60.2f, 1.6f); 
grass->FresnelR@ = XMFLOAT3(6.61f, 8.61f, 60.061f); 
grass->Roughness = 0.125f; 











// 当前 这 种 水 的 材质 定义 得 并 不 是 很 好 ， 但 是 由 于 我 们 还 未 学 会 所 需 的 全 部 演 染 工具 如 
透明 度 、 环 境 反 

// 射 等 ) ， 因 此 暂时 先 用 这 些 数据 解 当 务 之 急 吧 

auto water = std::make unique<Material>(); 

water->Name = "water"; 

water->MatCBIndex = 1; 

water->DiffuseAlbedo = XMFLOAT4(6.6f, 6.2f, 80.6f, 1.6f); 

water->FresnelR@ = XMFLOAT3(6.1f, 8.1f, 8.1f); 

water->Roughness = 0.06f; 

















mMaterials["grass"] std: :move(grass ) ; 
mMaterials["water"] std: :move(water); 





子 集 2 轮 胎 : 


子 集 3 窗 口 : 
利用 窗口 的 属性 来 演 
染 该 子 集中 的 三 角形 


子 集 0 前 照 灯 : 
利用 前 照 灯 属 性 来 泻 
染 该 子 集中 的 三 角形 


子 集 1 转 向 灯 : 
利用 转 问 灯 属 性 米 演 
染 该 子 集中 的 三 角形 


子 集 4 车 体 


利用 轮胎 属性 来 泻 染 利用 车 体 属性 来 演 染 
该 子 集中 的 三 角形 该 子 集中 的 三 角形 





图 8.22 一 辆 汽车 的 网 格 可 以 分 成 5 种 材质 属性 组 


通过 上 面 的 表 ， 可 以 将 材质 数据 存放 在 系统 内 存 之 中 。 而 为 了 令 
GPU 能 够 在 着 色 器 中 访问 到 这 些 材质 数据 ， 我 们 还 需要 将 相关 数据 复制 
到 和 常量 绥 冲 区 中 。 就 像 我 们 之 前 对 物体 常量 绥 冲 区 (per-object constant 
buffer) 所 做 的 一 样 ， 将 存 有 每 个 材质 常量 的 第 量 缓冲 区 添加 到 每 个 帧 
内 资源 FrameResource 之 中 : 








struct MaterialConstants 


{ 


DirectX: :XMFLOAT4 DiffuseAlbedo = 
DirectX: :XMFLOAT3 FresnelR6 = { 6. 


ef, 1.6f, 1.6f, 1.6f }; 


{ 1. 
0@1f, 6.601f, 0.01f }; 


float Roughness = 0.25f; 





// 在 纹理 


贴图 章节 中 会 有 





日 到 


DirectX: :XMFLOAT4X4 MatTransform = MathHelper: :Identity4x4() 


}; 


struct Fra 


{ 
public: 


meResource 


std: :unique ptr<UploadBuffer<MaterialConstants>> MaterialCB = 
nullptr; 


}; 
注意 到 结构 体 MaterialConstants 中 含有 Material 结 构 体 内 的 部 
分 数据 ， 即 着 色 器 在 演 染 时 所 需 的 相关 数据 。 


在 更 新 函数 中 ， 当 材质 数据 有 了 变化 《〈“ 即 存在 捷 谓 的 “ 脏 数 据 ”) 
时 ， 便 会 将 其 复制 到 常量 缓冲 区 的 对 应 子 区 域内 ， 因 此 GPU 材质 常量 组 
冲 区 中 的 数据 总 是 与 系统 内 存 中 的 最 新 材质 数据 保持 一 致 : 


void LitWavesApp: :UpdateMaterialCBs(const GameTimer& gt) 
{ 


auto currMaterialCB = mCurrFrameResource->MaterialCB. get(); 
for(auto& e : mMaterials) 














// 如 果 材 质 常量 数据 有 了 变化 就 更 新 常量 缓冲 区 数据 。 一 旦 常量 缓冲 区 数据 发 生 改变 ， 
就 需 对 每 一 个 帧 

// 资源 FrameResource 进 行 更 新 

Material* mat = e.second.get(); 

if(mat->NumFramesDirty > 6) 


























XMMATRIX matTransform = XMLoadFloat4x4(&mat->MatTransform); 


MaterialConstants matConstants ; 
matConstants.DiffuseAlbedo = mat->DiffuseAlbedo; 
matConstants.Fresne]lR6 = mat->FresnelLR6 
matConstants.Roughness = mat->Roughness; 


currMaterialCB->CopyData(mat->MatCBIndex, matConstants); 














// 也 需要 对 下 一 个 FrameResource 进 行 更 新 
mat->NumFramesDirty--; 








到 现在 为 止 ， 每 一 个 渔 染 项 都 已 含有 一 个 指向 Material 结 构 体 的 
指针 了 。 注 音 ， 多 个 泻 染 项 可 以 引用 相同 的 Material 对 象 ， 如 多 个 演 
染 项 能 够 使 用 相同 的 “ 板 砖 ?材质 。 而 每 个 Material 对 象 都 存 有 一 个 索 








引 ， 用 于 在 材质 常量 缓冲 区 中 指向 它 自 己 的 常量 数据 。 人 至 此 ， 我 们 就 能 
在 绘制 演 染 项 时 ， 找 到 对 应 常量 数据 的 虚拟 地 址 ， 并 将 它 与 所 需 材质 当 
量 数据 的 根 摘 述 符 相 绑 定 其实 也 可 以 通过 偏 移 到 堆 中 的 CBV 描 述 符 的 
方式 来 设置 一 个 描述 符 表 。 不 过 ， 在 此 演示 程序 中 ， 我 们 定义 的 根 俭 名 
采用 的 是 材质 音量 缓冲 区 的 描述 符 ， 并 非 描 述 符 表 ， 所 以 这 个 方法 在 此 
例 程 中 行 不 通 ) 。 下 列 代码 演示 了 如 何 用 不 同 的 材质 来 绘制 泻 染 项 : 








void LitWavesApp: :DrawRenderItems ( 
ID3D12GraphicsCommandList* cmdList， 
const std: :Vector<RenderItem*>& ritems ) 


UINT objCBByteSize = d3dUtil: :CalcConstantBufferByteSize 
(sizeof (ObjectConstants)); 

UINT matCBByteSize = d3dUtil::CalcConstantBufferByteSize 
(sizeof(MaterialConstants)); 


auto objectCB = mCurrFrameResource->0bjectCB->Resource(); 
auto matCB = mCurrFrameResource->MaterialCB->Resource(); 


// 针对 每 个 演 染 项 
for(size t i = 6; i «< ritems.size(); ++i) 


{ 





auto ri = ritems[i]; 


cmdList->IASetVertexBuffers(60, 1, &ri->Geo->VertexBufferView!()); 
cmdList->IASetIndexBuffer(&ri->Geo->IndexBufferView() ) ; 
cmdList->IASetPrimitiveTopology(ri->PpPrimitiveType); 


D3D12_GPU_VIRTUAL ADDRESS objCBAddress = 
objectCB->GetGPUVirtualAddress() + ri->0bjCBIndex*objCBByteSize; 

D3D12_GPU_VIRTUAL_ADDRESS matCBAddress = 
matCB->GetGPUVirtualAddress() + ri->Mat->MatCBIndex*matCBByteSiz 


cmdList->SetGraphicsRootConstantBufferView(6@, objCBAddress); 
cmdList->SetGraphicsRootConstantBufferView(1, matCBAddress); 


cmdList->DrawIndexedInstanced(ri->IndexCount, 1,， 
ri->StartIindexLocation, ri->BaseVertexLocation, 0); 





这 里 要 着 重 说 明 的 是 ， 我 们 需要 获取 三 角形 网 格 表 面 上 每 一 点 处 的 
法 问 量 ， 以 此 来 确定 光线 射 问 网 格 表 面 点 处 的 角度 《〈 用 于 明 伯 余 弱 定 
律 ) 。 而 为 了 获取 三 角形 网 格 表 面 上 每 个 点 处 的 近似 法 回 量 ， 我 们 吏 要 
在 顶点 这 一 层级 来 指定 法 线 。 在 三 角形 的 光栅 化 过 程 中 ， 便 会 利用 这 些 
顶点 法 线 进行 插值 计算 。 








到 目前 为 止 ， 我们 已 讨论 过 光 的 组 成 ， 但 是 还 未 讲 到 光源 的 具体 类 
型 。 下 面 我 们 将 描述 如 何 来 实现 平行 光源 、 点 光源 以 及 聚光灯 光源 。 








8.10 平行 光源 


平行 光源 (parallel light〉 也 称 方向 光源 (directional light， 也 译作 
定向 光源 ) ， 是 一 种 距离 目标 物体 极 远 的 光源 。 因 此 ， 我 们 就 可 以 将 这 
种 光源 发 出 的 所 有 入 射 光 看 作 是 彼此 平行 的 光线 〈 见 图 8.23) 。 再 者 ， 
由 于 光源 距 物 体 十 分 遥远 ， 我 们 就 能 忽略 距离 所 带 来 的 影响 ， 而 仅 指 定 
照射 到 场景 中 光线 的 区 强 〈light intensity) 。 


我 们 用 向 量 来 定义 平行 光源 ， 借 此 即 可 指定 光线 传播 的 方向 。 因 为 
这 些 光 线 是 相互 平行 的 ， 所 以 采用 相同 的 方向 向 量 代 之 。 而 光 向 量 与 光 
线 传播 的 方向 正 相 反 。 可 以 准确 模拟 出 方向 光 的 第 见 光 源 实例 是 太阳 
( 见 图 8.24)。 











图 8.23 ”照射 到 物体 表面 的 平行 光线 























图 8.24 ”这 张 图 并 没有 按照 实际 比例 绘制 ， 但 是 如 果 选 定 的 是 地 球 表面 上 的 一 小 块 范围 ， 
那么 照射 到 这 块 区 域内 的 光线 则 近似 于 平行 光 





8.11 ”点 光源 





一 个 与 点 光源 point light〉 比 较 贴 切 的 现实 实例 是 灯泡 ， 它 能 以 球 
面向 各 个 方向 发 出 光线 〈 见 图 8.25) 。 特 别 地 ， 对 于 任意 点 已 ， 由 位 置 
Q 处 点 光源 及 出 的 光线 ， 总 有 一 束 会 传播 至 此 点。 像 之 前 一 样 ， 我 们 定 
义 光 向 量 与 光 传 播 的 方 加 相反 ， 即 光 疝 量 的 方 加 是 由 点 P 指 问 点 光源 @ 





nd 
IQ -| 


> 
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图 8.25 ”点 光源 以 球面 向 各 个 方向 发 出 光线 。 特 别 是 对 于 任意 点 忆 ， 必 存在 一 始 于 点 光源 的 
光线 照射 到 此 点 








其 实 点 光 与 平行 光 之 间 唯一 的 区 别 就 是 光 向 量 的 计算 方法 一 一 对 于 
点 光 来 说 ， 光 向 量 随 着 目标 点 的 不 同 而 改变 ， 对 于 平行 光 而 言 ， 光 向 量 
则 保持 不 变 。 








聚 减 





在 物理 学 中 ， 光 强 会 根据 平方 反比 定律 (inverse squared law) 而 随 
着 距离 函数 发 生 衰 减 。 也 就 是 说 ， 距 离 光 源 4d 处 的 某 点 光 强 为 : 


10 
1(d) = 一 
d= 


其 中 ，70 为 距离 光源 d = 1 处 的 光 强 。 如 果 根 据 物理 学 来 设置 光量 值 
(light value) ， 并 且 辅 之 以 HDR (high dynamic range， 高 动态 范围 ) 
光照 与 色调 映射 〈tonemapping， 也 可 写作 tone mapping， 或 译作 色调 贴 
图 ) 技术 ， 那 效果 定 是 极 好 的 。 然 而 ， 我 们 在 这 里 却 要 使 用 一 种 更 为 简 
单 的 公式 ， 并 将 它 应 用 于 演示 代码 之 中 。 这 便 是 我 们 所 用 的 线性 衰减 
Cfalloff) 函数 : 














， falloffEnd — d 
att(d) = saturate 


falloffEnd — falloffStart 


图 8.26 中 所 搬 绘 的 束 是 此 线性 衰减 函数 的 图 像 。saturate 函 数 会 将 
它 的 参数 限定 在 [0, 1] 范 围 内 : 


TT.O0<rI<l1 
saturatelzX) = 0.T<0 
1l.T>>1 


att(d) 





falloffStart falloffEnd 

















图 8.26 ”在 距离 @ 未 达 falloffstart 之 前 ， 衰 减 因子 会 一 直 令 光量 值 保持 最 大 强度 〈1.0) 。 当 距离 
到 达 falloffEend 时 ， 豪 减 因 子 便 会 线性 衰减 至 0.0 



































用 此 式 计 算 点 光 光 量 与 用 式 (8.4) 计算 点 光 光 量 的 结果 是 相同 
的 ， 但 是 干 万 别 志 了， 我 们 还 须 再 将 衰减 因子 atttd)J 与 光源 的 直射 光量 
Biz 相 乘 。 注 意 ， 脓 减 并 不 会 影响 环境 光 项 ， 这 是 因为 环境 光 项 模拟 的 
古 问 四 处 反弹 后 照 财 到 目标 物体 的 间接 光 。 


在 使 用 上 述 娶 减 函 数 的 时 候 ， 奢 菏 点 到 光源 的 距离 大 于 或 等 于 
falloffend 则 不 会 受到 光照 。 这 便 为 我 们 提供 了 一 种 极 有 用 的 光照 优化 手 
段 : 在 着 色 器 程序 中 ， 如 果 一 个 点 超出 了 光照 的 有 效 范 围 ， 那 么 就 可 采 
用 动态 分 文 dynamic branching) 跳 过 此 处 的 光照 计算 并 提前 返回 。 


8.12 ”聚光灯 光源 





个 与 聚光灯 光源 〈spotlight) 相近 的 现实 实例 是 手电 和 位。 从 本 质 
上 来 说 ， 聚 光 灯 由 位 置 Q 同 方向 4 照射 出 范围 呈 圆 锥 体 的 光 〈 见 图 
B27 3 





为 了 实现 聚光灯 光源 ， 我 们 就 要 像 在 表示 点 光源 时 所 做 的 一 样 ， 先 
指定 光 回 量 : 
_.Q-fr 
le -P| 
其 中 ，P 为 被 照 点 的 位 置 ，Q@ 是 聚光灯 的 位 置 。 观 察 图 8.27 可 知 ， 
当 且 仅 当 位 于 -LL 与 d 之 间 的 夹 角 ? 小 于 圆锥 体 的 半 顶 角 2maz 时 ，PP 才 位 于 
聚光灯 的 圆锥 体 范 围 之 中 《所 以 它 才 可 以 被 光照 射 到 ) 。 而 且 ， 聚 光 灯 
圆锥 体 范 围 内 所 有 光线 的 强度 也 不 尽 相 同 。 位 于 圆锥 体 中 心 处 的 光线 
《 即 %2d 这 条 向 量 上 的 光线 ) 光 强 应 该 是 最 强 的， 而 随 着 角 2 由 0 增加 至 
， 光 强 会 逐渐 趋 近 





本 


图 8.27 一 个 聚光灯 以 位 置信 向 方向 d 发 射出 半 顶 角 为 ?max 的 圆锥 体 范围 的 光 




















那么 ， 怎 样 用 与 ?相关 的 函数 来 控制 光 强 的 衰减 ， 又 该 如 何 来 文 配 


聚光灯 的 圆锥 体 大 小 呢 ? 答案 是 : 我 们 可 以 使 用 与 图 8.19 中 曲线 相同 的 
冰 数 ， 但 是 要 以 2 蔡 换 0， 再 用 s 代 奉 m: 


kspot (8) = max (cos?,0) = max(—L.d.,0) 


这 正 古 我 们 所 期 得 的 公式 : 光 强 随 着 2” 的 增加 而 连续 且 平滑 地 素 
减 。 男 外 ， 通 过 修改 蜗 s， 我 们 束 能 够 间接 地 控制 %mar 使 光 强 降 为 0 的 
半 顶 角 角 度 ) 。 也 惑 是 说 ， 我 们 可 以 通过 设置 不 同 的 s 值 来 缩小 或 扩大 
聚光灯 光源 的 圆锥 体 照 射 范 围 。 例 如 ， 如 宁 设 s = 8， 则 圆锥 体 的 半 项 角 


束 交 近 45"。 


将 光源 的 直射 光量 召 z 与 衰减 因子 atttd) 相 乘 之 后 ， 还 要 根据 被 照射 
点 位 于 聚光灯 圆锥 体 的 具体 位 置 ， 用 聚光灯 因子 "et 按 比 例 对 光 强 进行 
缩放 。 除 了 上 述 操作 之 外 ， 聚 光 灯 的 光照 方程 与 式 〈8.4)〉 相 一 致 。 


可 以 看 出 ， 使 用 聚光灯 光源 比 使 用 点 光 光 源 的 代价 更 高 郧 ， 因 为 我 
们 需要 额外 计算 聚光灯 因子 fpot， 并 使 之 与 聚光灯 光 强 相 乘 。 类 似 地 ， 
扩 光 源 又 比方 回 光 源 的 开销 更 蝇 ， 因 为 点 光 需 要 针对 距离 4 进行 一 系列 
计算 (事实 上 ， 由 于 距离 的 计算 涉及 平方 根 运算 ， 因 此 这 个 计算 过 程 十 
分 耗费 资源 ) ， 并 且 还 需要 求 出 衰减 因 了 于 ， 再 令 它 与 点 光 光 强 相 乘 。 总 
而 言 之 ， 方 癌 光 是 最 廉价 的 光源 ， 点 光 次 之 ， 最 昂 贯 的 光源 则 是 聚 光 
灯 。 














8.13 ”光照 的 具体 实现 
我 们 在 本 节 中 将 对 方向 光 、 点 光 以 及 聚光灯 的 实现 细节 展开 讨论 。 
8.13.1 Light 结构 体 


在 d3dUtilh 头 文件 中 ， 我 们 定义 了 下 列 结 构 体 来 描述 光源 。 此 结构 
体 可 以 表示 方 癌 光源 、 点 光源 与 聚光灯 光源 。 但 是 根据 光源 的 具体 类 
型 ， 我 们 并 不 会 用 到 其 中 的 所 有 数据 。 比 如 说 ， 在 使 用 点 光 时 就 不 会 用 
到 Direction〔 方 同 光 )〉 数据 成 员 。 





struct Light 
{ 
DirectX: :XMFLOAT3 Strength = {6.5f，6.5f，6.5f};  // 光源 的 颜色 
float Falloffstart = 1.6f; // 仅 供 点 光源 /聚光灯 光 
源 使 用 
DirectX: :XMFLOAT3 Direction = {6.6f，-1.6f，6.6f}; // 仅 供 方向 光源 /聚光灯 
光源 使 用 




















float FalloffEnd = 16.6f; // 仅 供 点 光源 /聚光灯 光 
源 使 用 
DirectX: :XMFLOAT3 Position = { 6.6f，6.6f，6.6f }; // 仅 供 点 光源 /聚光灯 光 
源 使 用 
float SpotPower = 64.6f; // 仅 供 聚 光 灯 光源 使 用 
}; 



































文件 LightingUtil.hlsl 中 则 定义 了 与 之 对 应 的 结构 体 : 





struct Light 

{ 
float3 Strength; 
float Falloffstartj // 仅 供 点 光源 /聚光灯 光源 使 用 
float3 Direction;  // 仅 供 方向 光源 /聚光灯 光源 使 用 
float FalloffEnd;  // 仅 供 点 光源 /聚光灯 光源 使 用 
float3 Position; // 仅 供 点 光源 /聚光灯 光源 使 用 











float SpotPower; // 仅 供 聚光灯 光源 使 用 
}; 








结构 体 Light 中 数据 成 员 的 排列 顺序 并 不 是 随意 指定 的 (结构 
体 MaterialConstants 也 是 如 此 ) ， 这 要 遵从 HLSL 的 结构 体 封装 规则 
Cstructure packing rule〉。 详 情 可 见 附录 B 中 的 “常量 缓冲 区 的 封装 规 
则 ”。 这 条 HLSL 规 则 的 大 意 是 以 填充 对 齐 的 方式 ， 将 结构 体 中 的 元 素 打 
包 为 4D 癌 量 。 另 外 ， 根 据 规 则 的 限制 ， 单 个 元 素 不 能 以 一 分 为 二 的 方 
式 分 到 两 个 4D 辣 量 之 中 。 这 就 意味 着 最 好 将 上 述 结 构 体 打包 为 3 个 4D 问 
量 ， 融 像 下 面 这 样 : 














vector 1: (Strength.x, Strength.y, Strength.z, FalloffStart) 


vector 2: (Direction.x, Direction.y, Direction.z, FalloffEnd) 
vector 3: (Position.x, Position.y, Position.z, SpotPower) 





从 为 一 方面 来 说 ， 如 果 将 结构 体 写 作 : 


struct Light 

{ 
DirectX: :XMFLOAT3 Strength; // 光源 的 颜色 
DirectX: :XMFLOAT3 Direction;// 仅 供 方向 光源 /聚光灯 光源 使 用 
DirectX: :XMFLOAT3 Position; // 仅 供 点 光源 /聚光灯 光源 使 用 
float FalloffStart; // 仅 供 点 光源 /聚光灯 光源 使 用 
float FalloffEnd; // 仅 供 点 光源 /聚光灯 光源 使 用 
float SpotPower; // 仅 供 聚 光 灯 光源 使 用 

}; 

















struct Light 
{ 


float3 Strength; 

float3 Direction;  // 仅 供 方向 光源 /聚光灯 光源 使 月 
float3 Position; // 仅 供 点 光源 /聚光灯 光源 使 用 
float FalloffStart; // 仅 供 点 光源 /聚光灯 光源 使 用 
float FalloffEnd; // 仅 供 点 光源 /聚光灯 光源 使 用 
float SpotPower; // 仅 供 聚光灯 光源 使 用 





























(Strength.x, Strength.y, Strength.z, empty) 
: (Direction.x, Direction.y, Direction.z, empty) 


: (Position.x, Position.y, Position.z, empty) 
(FalloffStart, FalloffEnd, SpotPpower, empty) 











可 以 看 出 ， 第 二 种 方法 占用 了 更 多 的 空间 ， 但 这 还 是 其 次 。 此 方法 
存在 的 更 严重 的 问题 是 : 在 C++ 应 用 程序 代码 中 ， 应 有 与 HLSL 部 分 相 
对 应 的 结构 体 ， 但 是 C++ 结构 体 与 HLSL 结 构 体 的 封装 规则 并 不 相同 。 
因此 ， 硅 非 小 心地 按 HLSL 封 疙 法 则 来 实现 C++ 与 HLSL 的 结构 体 ， 那 么 
两 者 的 结构 体 布局 很 有 可 能 是 不 匹配 的 。 如 果 这 两 种 结构 体 不 匹配 ， 则 
通过 memcpy 函 数 从 CPU 上 传 至 GPU 常量 缓冲 区 的 数据 将 会 导致 泻 染 错 
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天。 

















8.13.2 ”第 用 辅助 函数 


下 面 的 3 个 函数 定义 于 LightingUtil.hlsl 文 件 中 ， 由 于 这 些 代码 可 处 理 
多 种 类 型 的 光照 ， 所 以 我 们 将 其 定义 为 辅助 函数 。 


1. CalcAttenuation: 实现 了 一 种 线性 衰减 因子 的 计算 方法 ， 可 
将 其 应 用 于 点 光源 与 聚光灯 光源 。 








2. SchlickFresnel: 代替 菲 涅 耳 方 程 的 石 里 克 近 似 。 此 函数 基于 
光 回 量 五 与 表面 法 线 m 之 间 的 夹 角 ， 并 根据 菲 涅 耳 效应 近似 地 计算 出 以 m 
为 法 线 的 表面 所 反射 光 的 百分比 。 


3. BlinnPhong: 计算 反射 到 观察 者 眼中 的 光量 ， 该 值 为 漫 反 射 光 
量 与 镜面 反射 光量 的 总 和 。 





float CalcAttenuation(float d, float falloffStart, float falloffEnd) 


{ 

// 线性 衰减 

return saturate((falloffEnd-d) / (falloffEnd - falloffStart)); 
} 


// 石 里 死 提 出 的 一 种 逼近 菲 涅 耳 反 射 率 的 近似 方法 

// (参见 "Real-Time Rendering 3rd Ed." 第 233 页 ) 

// Re = ( (n-1)/(n+1) )^2， 式 中 的 n 为 折射 率 

float3 SchlickFresnel(float3 RO@, float3 normal, float3 lightVec) 
{ 




















float cosIncidentAngle = saturate(dot(normal, lightVec)); 


float f6 = 1.6f - cosIncidentAngle; 
float3 reflectPercent = RO + (1.6f - RO)*(fO*foO*fO*fO*f0); 


return reflectPercent; 








} 
struct Material 
{ 
float4 DiffuseAlbedo; 
float3 FresnelR®,; 
// 光泽 度 与 粗糙 度 是 一 对 性 质 相 反 的 属性 : Shininess = 1-roughness。 
float Shininess ; 
}; 


float3 BlinnPhong(float3 lightStrength, float3 lightVec, 
float3 normal, float3 toEye, Material mat) 


{ 

















// m 由 光泽 度 推导 而 来 ， 而 光泽 度 则 根据 粗糙 度 求 得 
const float m = mat.Shininess * 256.60f; 
float3 halfVec = normalize(toEye + lightVec); 


float roughnessFactor = (m + 8.6f)*pow(max(dot(halfVec, normal), 
0.6f), m) / 8.6f; 
float3 fresnelFactor = SchlickFresnel(mat.FresnelR@, halfVec, lightVec); 








// 尽管 我 们 进行 的 是 LDR (low dynamic range， 低 动态 范围 ) 泻 染 ， 但 spec (镜面 有 反 
射 ) 公式 得 到 
// 的 结果 仍 会 超出 范围 [8,1]， 因 此 现 将 其 按 比例 缩小 一 些 





























specAlbedo = specAlbedo / (specAlbedo + 1.6f); 
return (mat.DiffuseAlbedo.rgb + specAlbedo) * 1ightstrength ; 
} 


上 述 代 码 中 所 用 的 HLSL 内 部 函数 dot、pow 与 max 分 别 是 癌 量 点 积 
函数 、 圭 函数 以 及 取 最 大 值 函 数 。 大 多 数 的 HLSL 内 部 函数 描述 可 以 从 
本 书 的 附录 B 中 找到 。 除 此 之 外 ， 那 里 还 给 出 了 一 份 HLSL 的 语法 概览 。 
有 一 点 需要 注意 的 是 ， 当 使 用 operator* 令 两 个 向 量 相 乘 时 ， 即 表示 此 乘 
法 运算 的 计算 方式 是 分 量 式 乘法 。 








注 意 Note 


我 们 采用 的 镜面 反照 率 计 算 公 式 允 许 其 镜面 值 大 于 1， 这 表示 非 第 
滩 眼 的 蜗 光 。 然 而 ， 我 们 却 希 望 泻 染 目 标的 颜色 值 在 [0, 1] 这 个 低 动态 范 
围 内 ， 因 此 一 般 来 说 将 高 于 此 范围 的 数值 简单 地 钳制 为 1.0 即 可 。 但 
是 ， 为 了 获得 更 加 柔和 的 镜面 高 光束 不 宜 “ 一 思 切 ” 式 地 钳制 数值 了 ， 而 
是 需 要 按 比 例 缩小 镜面 反照 率 : 


specAlbedo = specAlbedo / (specAlbedo + 1.6f); 


高 动态 范围 CHDR) 光照 使 用 的 是 光量 值 可 超出 范围 [0, 1] 的 浮 点 
泻 染 目标 ， 在 进行 色调 贴图 这 个 步骤 时 ， 出 于 显示 的 目的 会 将 高 动态 范 
围 映射 回 [0, 1] 区 间 ， 而 在 这 个 转换 的 过 程 中 ， 保 留 细节 信息 是 很 重要 的 
一 项 任务 。HDR 演 染 与 色调 映射 本 吴 就 是 一 门 单 独 的 学 科 一 一 详 见 教材 
[Reinhard10]。 而 在 另 一 篇 文章 [Pettineo12] 中 也 给 出 了 比较 详尽 的 介 
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， 还 附 有 供 读 者 用 以 实验 的 演示 程序 。 


1 


注音 Note > 


在 计算 机 中 ，HLSL 所 用 的 全 都 是 内 联 函 数 。 因 此 ， 对 于 函数 或 传 
递 参数 而 言 并 不 会 有 过 多 的 性 能 开销 。 





8.13.3 ”实现 方向 光源 


给 定 观察 位 置 五 、 材 质 属 性 ， 与 以 m” 为 法 线 的 表面 上 可 见 一 点 忆 ， 则 
下 列 HLSL 函 数 将 输出 自 茶 方 同 光源 友 出 ， 经 上 述 表面 以 方 问 
v 二 normalize(E 一 Pj) 反射 入 观察 者 眼中 的 光量 。 在 我 们 的 示例 中 ， 此 也 
数 将 由 像素 着 色 器 所 调用 ， 以 基于 光照 确定 像素 的 颜色 。 
float3 ComputeDirectionalLight(Light L, Material mat, float3 normal, 
float3 toEye) 


// 光 向 量 与 光线 传播 的 方向 刚好 相反 
float3 lightVec = -L.Direction; 


// 通过 朗 伯 余弦 定律 按 比例 降低 光 强 
float ndotl = max(dot(lightVec, normal), 8.06f); 
float3 lightSstrength = L.Strength * ndotl; 











return BlinnPphong(lightStrength, lightVec, normal, toEye, mat); 





8.13.4 ”实现 点 光源 


给 出 观察 点 百 、 以 m 作 为 法 线 的 表面 上 可 视 一 点 P 以 及 材质 属性 ， 则 
下 面 的 HLSL 函 数 将 会 输出 从 点 光源 放出 ， 经 上 述 表 面 在 
v 一 Dormalizet 王 一 2 方向 反射 入 观察 者 眼中 的 光量 。 在 我 们 的 示例 中 ， 
该 函数 将 伞 像素 痢 色 器 所 调用 ， 并 根据 光照 来 确定 像 系 的 颜色 。 


float3 ComputePointLight(Light L, Material mat, float3 pos, float3 normal, 


float3 toEye) 





// 自 表面 指向 光源 的 向 量 
float3 lightVec = L.Position - pos; 








// 由 表面 到 光源 的 距离 
float d = length(lightVec); 





// 范围 检测 
if(d > L.FalloffEnd) 
return 6.6f; 











// 对 光 向 量 进行 规范 化 处 理 
lightVec /= d; 








// 通过 朗 伯 余弦 定律 按 比例 降低 光 强 
float ndotl = max(dot(lightVec, normal), 068.6f); 
float3 lightSstrength = L.Strength * ndotl; 








// 根据 距离 计算 光 的 衰减 
float att = CalcAttenuation(d, L.FalloffStart, L.FalloffEnd); 
lightStrength *= att; 


return BlinnPphong(lightStrength, lightVec, normal, toEye, mat); 





8.13.5 ”实现 聚光灯 光源 


指定 观察 点 E、 以 n 为 法 线 的 表面 上 可 视 一 点 P 以 及 材质 属性 ， 则 下 
面 的 HLSL 函 数 将 会 输出 来 自 聚 光 灯 光源 ， 经 过 上 述 表面 以 方向 
v 二 normalize(E 一 Pp) 反 射 入 观察 者 眼中 的 光量 。 在 我 们 的 示例 中 ， 此 函 
数 将 在 像素 着 色 器 中 被 调用 ， 以 根据 光照 确定 像素 的 颜色 。 





float3 ComputeSpotLight(Light L, Material mat, float3 pos, float3 normal, 
float3 toEye) 





// 从 表面 指向 光源 的 向 量 
float3 lightVec = L.Position - pos; 





// 由 表面 到 光源 的 距离 
float d = length(lightVec); 





// 范围 检测 
if(d > L.FalloffEnd) 
return 6.6f; 

















// 对 光 向 量 进行 规范 化 处 理 
lightVec /= d; 


// 通过 朗 伯 余弦 定律 按 比例 缩小 光 的 强度 
float ndotl = max(dot(lightVec, normal), 8.06f); 
float3 lightSstrength = L.Strength * ndotl; 








// 根据 距离 计算 光 的 衰减 
float att = CalcAttenuation(d, L.FalloffStart, L.FalloffEnd); 
lightStrength *= att; 

















// 根据 聚光灯 照明 模型 对 光 强 进行 缩放 处 理 

float spotFactor = pow(max(dot(-lightVec, L.Direction), 86.6f), L.SpotPow 
er); 

lightStrength *= spotFactor; 








return BlinnPphong(lightStrength, lightVec, normal, toEye, mat); 
} 





8.13.6 ”多 种 光照 的 车 加 


光 强 是 可 以 登 加 的 。 因 此 ， 在 文 持 多 个 光源 的 场景 中 ， 我 们 需要 过 
历 每 一 个 光源 ， 并 把 它们 在 我 们 要 计算 光照 的 点 或 像 系 上 的 贡献 值 求 
和 。 示 例 框架 最 多 可 文 持 16 个 光源 ， 攒 此 便 可 以 用 方 网 光 、 点 光 与 聚 光 
灯 三 种 光源 进行 奉 干 组 合 。 当 然 ， 前 提 是 光源 的 总 数 不 能 超过 16 个 。 此 
外 ， 代 码 所 采用 的 约定 是 方向 光源 必须 位 于 光照 数组 的 开始 部 分 ， 反 光 
源 次 之 ， 聚 光 灯 光源 则 排 在 末尾 。 下 列 代 码 用 于 计算 某 点 处 的 光照 方 
程 : 








#define MaxLights 16 


// 绘制 过 程 中 所 用 的 杂项 常量 数据 
cbuffer cbPass : register(b2) 
{ 


// 对 于 每 个 以 MaxLights 为 光源 数量 最 大 值 的 对 象 来 说 ， 索 引 [86，NUM_DIR_LIGHTS ) 表 示 
的 是 方向 光源 ， 

// 索引 [NUM_DIR_LIGHTS，NUM_DIR_LIGHTS+NUM_POINT_LIGHTS) 表 示 的 是 点 光源 

// 索引 [NUM_DIR_LIGHTS+NUM_POINT_LIGHTS，NUM_DIR_LIGHTS+NUM_POINT_LIGHT+NU 
M_SPOT 

// LIGHTS) 则 表示 的 是 聚光灯 光源 














Light gLights[MaxLights]; 
}; 


float4 ComputeLighting(Light gLights[MaxLights], Material mat， 
float3 pos, float3 normal, float3 toEye, 
float3 shadowFactor) 


float3 result = 6.6f; 
int i = 0@; 


#if (NUM DIR_LIGHTS > 6) 
for(i = 8; i < NUM DIR LIGHTS; ++i) 
{ 
result += shadowFactor[i] * ComputeDirectionalLight(gLights[i], 
mat, normal, toEye); 


} 
#endif 


#if (NUM_POINT_LIGHTS > 6) 
for(i = NUM DIR LIGHTS; i < NUM DIR LIGHTS+NUM POINT LIGHTS; ++i) 
{ 
result += ComputepointLight(gLights[i], mat, pos, normal, toEye); 
} 
#endif 


#if (NUM SPOT_LIGHTS > 6) 
for(i = NUM DIR LIGHTS + NUM POINT_ LIGHTS; 
i < NUM DIR LIGHTS + NUM POINT_LIGHTS + NUM SPOT_LIGHTS; 
++i) 
{ 
result += ComputeSpotLight(gLights[i], mat, pos, normal, toEye); 
} 
#endif 


return float4(result, 8.6f); 
} 








可 以 观察 到 每 种 类 型 光源 的 数量 实 由 多 个 #define 来 加 以 控制 。 这 
样 一 来 ， 着 色 器 将 仅 针 对 实际 所 需 的 光源 数量 来 进行 光照 方程 的 计算 。 
因此 ， 如 果 一 个 应 用 程序 只 需 3 个 光源 ， 则 我 们 仅 对 这 3 个 光源 展开 计 
算 。 如 果 应 用 程序 在 不 同 阶段 要 文 持 不 同 数量 的 光源 ， 那 么 只 需 生 成 以 
不 同 #define 来 定义 的 不 同 着 色 需 即 可 。 











参数 shadowFactor 在 介绍 阴影 的 章节 中 才 会 用 到 。 我 们 暂时 仅 将 
它 设置 为 向 量 (1, 1, 1)， 这 会 使 此 阴影 因子 在 方程 中 不 会 产生 任何 效果 ，。 


8.13.7 HLSL 主 文件 











下 面 的 代码 含有 本 章 演 示 程 序 中 所 用 的 顶点 着 色 器 与 像素 着 色 器 ， 
而 其 中 所 涉及 的 LightingUtilhlsl 文 件 中 的 HLSL 人 代码， 我 们 都 已 在 此 前 进 
行 了 讨论 。 





VB Bh nnd dd dt ta rt ee dt te 


// Default.hlsl 的 作者 为 Frank Luna (C) 2615 版 权 所 有 
// 
// 默认 着 色 器 ， 目 前 已 支持 光照 


人 /本 米 洲 米 米 汶 玉 玉米 炒米 六 炒米 玉米 术 米 米 米 玉 术 米 玉米 米 米 米 术 洲 玉 炒米 炒米 术 米 水 岂 玉 米 米 术 玉林 术 米 米 水 米 米 洒 机 玉米 炒米 米 举 术 米 米 洲 米 米 水 玉米 米 














// 光源 数量 的 默认 值 
#ifndef NUM_DIR_LIGHTS 

#define NUM DIR LIGHTS 1 
#endif 





#ifndef NUM POINT_ LIGHTS 
#define NUM POINT_ LIGHTS 6 
#endif 


#ifndef NUM SPOT_LIGHTS 
#define NUM SPOT_LIGHTS 6 
#endif 


// 包含 了 光照 所 用 的 结构 体 与 函数 
#include "LightingUtil.hlsl" 











// 每 帧 都 有 所 变化 的 常量 数据 
cbuffer cbPerObject : register(b6) 


{ 
float4x4 gWorld; 
}; 


// 每 种 材质 的 不 同 常量 数据 
cbuffer cbMaterial : register(b1) 
{ 

float4 gDiffuseAlbedo; 

float3 gFresnelRe; 

float gRoughness; 

float4x4 gMatTransform; 


}; 
// 绘制 过 程 中 所 用 的 杂项 常量 数据 
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cbuffer cbPass : register(b2) 
{ 
float4x4 gView; 
float4x4 gInvView; 
float4x4 gProj; 
float4x4 gInvProj; 
float4x4 gViewProj; 
float4x4 gInvViewProj; 
float3 gEyePoskW; 
float cbPerObjectPad1; 
float2 gRenderTargetSize; 
float2 gInvRenderTargetSize; 
float gNearz; 
float gFarz; 
float gTotalTime; 
float gDeltaTime; 
float4 gAmbientLight; 





// 对 于 每 个 以 MaxLights 为 光源 数量 最 大 值 的 对 象 来 说 ， 索 引 [86，NUM_DIR_LIGHTS ) 表 


// 源 ， 索 引 [NUM_DIR_LIGHTS，NUM_DIR_LIGHTS+NUM_POINT_LIGHTS) 表 示 的 是 点 光源 


示 的 是 方向 光 











// 索引 [NUM_DIR_LIGHTS+NUM_POINT_LIGHTS，NUM_DIR_LIGHTS+NUM_POINT_LIGHT+ 


NUM_SPOT __ 
// LIGHTS) 表 示 的 是 聚光灯 光源 


Light gLights[MaxLights]; 
}; 


struct VertexIn 

{ 
float3 PosL : POSITION; 
float3 NormalL : NORMAL; 


}; 


struct VertexOut 

{ 
float4 PosH : SV_POSITION; 
float3 PosW : POSITION; 
float3 NormalW : NORMAL; 


}; 


VertexOut VS(VertexIn vin) 


{ 
VertexOut vout = (VertexOut)0.ef; 














// 将 顶点 变换 到 世界 空间 





float4 posW = mul(float4(vin.PosL，1.6f)， 


gNor1d) ; 


} 


Vvout .PosN = posW.xyz; 














// 假设 这 里 进行 的 是 等 比 缩放 ， 否 则 这 里 需要 使 用 世界 矩阵 的 逆转 置 矩 阵 
vout .NormalN = mul(vin.NormalL, (float3x3)gWorld); 























// 将 顶点 变换 到 齐 次 裁剪 空间 
vout .PosH = mul(posNW，gViewProj); 


return vout; 


float4 PS(VertexOut pin) : SV_Target 


{ 


























// 对 法 线 插值 可 能 导致 其 非 规 范 化 ， 因 此 需要 再 次 对 它 进行 规范 化 处 理 


pin.NormalW = normalize(pin.NormalW); 


























// 光线 经 表面 上 一 点 反射 到 观察 点 这 一 方向 上 的 向 量 
float3 toEyeN = normalize(gEyePosW - pin.PosW); 














// 间接 光照 
float4 ambient = gAmbientLight*gDiffuseAlbedo; 


// 直接 光照 

const float shininess = 1.6f - gRoughness ; 

Material mat = { gDiffuseAlbedo，gFresnelJR6，shininess }; 

float3 shadowFactor = 1.6f; 

float4 directLight = ComputeLighting(gLights, mat, pin.PosW, 
pin.NormalW, toEyeW, shadowFactor); 





float4 litColor = ambient + directLight; 


// 从 漫 反 射 材质 中 获取 alpha 值 的 常见 手段 
litColor.a = gDiffuseAlbedo.a; 





return litColor; 








8.14 ”光照 演示 程序 








本 光照 演示 程序 是 在 第 7 章 “Land and Waves” 例 程 的 基础 之 上 构建 而 
成 的 。 其 中 利用 了 一 个 方 同 光 来 表示 太阳 。 用 户 可 以 用 左 、 右 、 上 、 下 
4 个 方 回 键 来 控制 太阳 的 方位 。 由 于 我 们 已 经 讨论 过 如 何 实现 材质 与 光 
源 ， 所 以 下 面 的 各 小 节 中 仅 处 理 尚 未 实现 的 部 分 细节 。 图 8.28 是 一 张 光 
照 演 示 程 序 的 效果 。 














图 8.28 ”光照 演示 程序 的 屏幕 效果 





8.14.1 ”顶点 格式 


光照 的 计算 依赖 于 表面 法 线 。 我 们 在 顶点 层级 定义 了 法 线 ， 借 此 对 
位 于 三 角形 中 的 每 个 像素 都 进行 插值 计算 ， 由 此 展开 逐 像 系 光照 。 力 
外 ， 我 们 也 不 再 指定 项 点 的 颜色 ， 而 是 以 每 个 像素 应 用 光照 方程 后 所 生 


成 的 像素 颜色 加 以 代替 。 为 了 支持 顶点 法 线 ， 我 们 将 之 前 的 顶点 结构 修 
改 如 下 : 


// C++ 顶点 结构 体 


struct Vertex 


DirectX: :XMFLOAT3 Pos ; 
DirectX: :XMFLOAT3 Normal; 


}; 


// 对 应 的 HLSL 顶 点 结构 体 


struct VertexIn 


float3 PosL : POSITION; 
float3 NormalL : NORMAL; 


}; 





当 修 改 了 顶点 格式 后 ， 我 们 就 要 随 之 更 新 输入 布局 描述 来 对 比 进行 
说 明 : 


mInputLayout = 


{ "POSITION"，6，DXGI_FORMAT_R32G32B32_FLOAT，6，6， 


D3D12_INPUT_CLASSIFICATION_PER_VERTEX_DATA，6 }, 
{ "NORMAL", 60, DXGI_ FORMAT R32G32B32_FLOAT, 68，12,，, 
D3D12_INPUT_CLASSIFICATION PER VERTEX DATA, 0 } 


}; 





8.14.2 ”计算 法 线 


GeometryGenerator 类 中 用 于 生成 各 种 几何 形状 的 函数 ， 已 能 够 

过 顶点 法 线 去 创建 对 应 的 图 形 数据 ， 可 谓 万 事 俱 备 。 然 而 ， 由 于 我 们 
ep (terrain〉 表 面 更 加 真实 而 修改 了 此 演示 程序 中 的 栅 格 高 
度 ， 所 以 还 需 为 地 形 生成 法 向 量 。 








因为 地 形 曲面 由 函数 ! = fl7z, 3) 给 出 ， 所 以 我 们 可 以 通过 微 积 分 知 
识 来 直接 计算 法 向 量 ， 而 不 必 再 用 8.2.1 节 中 所 述 的 求法 线 平均 值 方法 。 
为 此 ， 针 对 曲面 上 的 每 一 个 点 ， 我 们 都 通过 偏 导 数 在 +z 与 +: 方 向 上 建立 
两 个 切 向 量 (tangent vector) : 


至 充 三 (sn 
?7 一 (Ro) 
这 两 个 同 量 都 位 于 曲面 点 的 切 平面 上 ， 求 这 两 个 同 量 的 又 积 即 可 得 
到 对 应 点 处 的 法 同 量 : 
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OF OF 
轩 [Le Se 
用 来 生成 陆地 网 格 的 函数 为 : 


flz,z) = 0.3z: sin(0.17) + 0.37: cos(0.12) 





则 偏 导数 为 : 
Of | Rg | , 
—— = 0.03z:cos(0.17z) 十 0.3cos(0.1z) 
OT 
OF \ . Sy , 
2 0.3sin(0.17z) — 0.037r: sin(0.12) 
Oz 


而 位 于 曲面 上 一 点 (7;f(7, ,3 处 的 曲面 法 线 为 : 





人 
of of 一 0.03z :cos(0.17) — 0.3cos(0.12) 
亲人 2) 三 一 , 1, 一 ] 一 l 


OT Oz —0.3sin(0.17) 十 0.037 : sin(0.12z) 


我 们 可 以 注意 到 曲面 法 线 并 不 上 共有 单位 长 度 ， 所 以 在 光照 计算 之 前 
还 需 对 它 进行 规范 化 处 理 。 


我 们 要 在 每 个 项 点 处 都 进行 上 述 的 法 线 计 算 ， 以 获取 对 应 的 项 点 法 
线 : 


XMFLOAT3 LitWavesApp::GetHillsNormal(float x, float z)const 
{ 
// n= (-df/dx, 1, -df/dz) 
XMFLOAT3 n( 
-0.03f*z*cosf(@.1f*x) - 8.3f*cosf(0.1f*z), 
1.6f， 
-0.3f*sinf(0.1f*x) + 0.063f*x*sinf(0.1f*z)); 


XMVECTOR unitNormal = XMVector3Normalize(XMLoadFloat3(&n)); 
XMStoreFloat3(&n, unitNormal); 


return n; 





水 面 的 法 回 量 与 陆地 表面 法 同 量 的 求法 相似 ， 只 是 我 们 还 没有 找到 
用 于 计算 水 面 的 相应 公式 。 但 是 ， 每 个 顶点 处 的 切 向 量 都 可 用 有 限 差 分 
格式 (finite difference scheme) 来 近似 计算 (参见 [Lengyel02] 或 其 他 与 
数值 分 析 有 关 的 书籍 〉。 





如 果 读 者 对 微 积 分 方面 的 知识 比较 生 想 ， 也 不 上 必 担 心 ， 因 为 这 并 不 








是 本 书 的 重头 戏 。 它 现在 显得 比较 重要 的 原因 是 我 们 需要 用 数学 描述 的 
曲面 来 生成 几何 体 ， 以 此 来 绘制 一 些 有 趣 的 物体 。 在 后 面 的 章节 中 ， 我 
们 会 改 为 从 文件 中 加 载 由 3D 建 模 程序 导出 的 3D 网 格 。 





8.14.3 ”更 新 光照 的 方 同 


正如 8.13.7 节 中 所 述 ，Light 数 组 被 置 于 演 染 过 程 常量 绥 冲 区 〈per- 
pass constant buffer) 中。 演示 程序 使 用 了 一 个 方 同 光源 来 表示 太阳 ， 并 
允许 用 户 通 过 左 、 右 、 上 、 下 4 个 方向 键 来 控制 光源 的 方位 。 这 就 是 
说 ， 我 们 需要 在 每 一 帧 中 都 重新 计算 阳光 照射 的 方向 ， 并 将 结果 设置 到 
泻 染 过 程 常 量 缓冲 区 内 。 











我 们 用 球 坐 标 !2;4, 2 来 追踪 太阳 的 位 置 ， 但 是 ， 由 于 假设 太阳 距 此 
是 无 限 远 的 ， 所 以 径 同 距离 p 的 取 值 是 无 关 紧 要 的 。 这 里 设 ? = 1， 以 此 
令 太 阳 位 于 单位 球面 这 一 轨道 之 上 ， 即 用 (1,0, 9?) 来 表示 太阳 的 朝向 。 而 
光 的 方 同 与 太阳 的 朝 同 正 相 反 。 下 列 是 用 于 更 新 太阳 方位 的 相关 代码 。 














float mSunTheta = 1.25f*XM _ PI; 
float mSunPhi = XM _ PIDIV4; 


void LitWavesApp: :OnKeyboardInput(const GameTimer& gt) 
const float dt = gt.DeltaTime(); 


if(GetAsyncKeyState(VK_LEFT) & 6x8666) 
mSunTheta -= 1.6f*dt; 


if(GetAsyncKeyState(VK_RIGHT) & 6x806060) 
mSunTheta += 1.6f*dt; 


if(GetAsyncKeyState(VK_UP) & 6x8660) 
mSunPhi -= 1.6f*dt; 


if(GetAsyncKeyState(VK_DONN) & 6x8666) 
mSunPhi += 1.6f*dt; 


mSunPhi = MathHelper: :Clamp(mSunPhi, 68.1f, XM PIDIV2); 
} 


void LitWavesApp: :UpdateMainpassCB(const GameTimer& gt) 
{ 


XMVECTOR lightDir = -MathHelper::SphericalToCartesian(1.6f， 
mSunTheta, mSunPhi); 


XMStoreFloat3(&mMainpassCB.Lights[06] .Direction, lightDir); 
mMainPassCB.Lights[6].Strength = { 1.6f, 1.6f, 68.9f }; 


auto currPassCB = mCurrFrameResource->PassCB. get(); 
CurrPassCB->CopyData(6，mMainPassCB) ; 





将 Light 数 组 放 在 泻 染 过 程 常 量 缓冲 区 中 ， 就 意味 着 在 泻 染 过 程 中 
所 用 的 光源 不 能 超过 16 个 〈 此 值 是 程序 能 文 持 的 最 多 光源 数量 ) 。 这 对 
小 的 演示 程序 来 说 没有 什么 影响 。 但 是 对 于 大 型 的 游戏 场景 而 言 ， 这 
远 远 不 够 的 ， 我 们 应 该 可 以 想象 得 出 : 在 游戏 这 一 级 别 上 的 应 用 ， 会 
到 数 以 百 计 的 光源 遍布 场景 。 而 对 于 这 种 情况 的 一 种 解决 方案 是 
将 Light 数 组 置 于 物体 常量 缓冲 区 (per-object constant buffer) 中 。 接 下 
来 ， 针 对 每 个 物体 O， 我 们 可 以 在 场景 中 搜寻 会 作用 于 它 的 光源 ， 并 将 
这 些 光 源 与 此 物体 的 常量 缓冲 区 相 绑 定 。 如 此 一 来 ， 这 些 光 源 便 会 以 它 
的 光照 范围 《点 光源 是 球体 而 聚光灯 光源 是 圆锥 体 ) 来 照射 物体 O。 除 








诺 


瑾 





此 之 外 ， 另 一 种 第 见 的 策略 是 使 用 延迟 泻 染 〈deferred rendering) 或 


Forward+ 泻 染 等 技术 。 


8.14.4 ”更 新 根 签名 


为 了 实现 光照 ， 我 们 为 着 色 器 程序 引入 了 一 个 新 的 材质 常量 缓冲 
区 。 为 了 文 持 这 个 新 添加 的 第 量 缓冲 区 ， 束 需要 改写 之 前 的 根 签名 。 正 
如 物体 常量 缓冲 区 (per-object constant buffer) 一 样 ， 对 于 材质 常量 组 
证 区 我 们 也 使 用 了 相应 的 根 扩 述 符 ， 这 样 便 可 以 绕 过 描述 符 堆 而 直接 绑 
定常 量 缓冲 区 。 


8.15 ”小 结 


1. 运用 光照 后 ， 我 们 惑 不 再 指定 每 个 顶点 的 颜色 ， 取 而 代 之 的 古 
要 定义 场景 光源 与 每 个 顶点 的 材质 。 可 将 材质 看 作 是 确定 光 与 物体 表面 
如 何 互相 交互 的 一 种 属性 。 通 过 对 三 角形 表面 每 个 项 点 处 的 材质 进行 插 
值 ， 即 可 获取 三 角形 网 格 中 每 一 个 表面 点 处 的 材质 数据 。 光 照 方程 则 根 
据 光 与 表面 材质 之 间 的 交互 来 计算 观察 者 所 见 到 的 表面 颜色 。 除 此 之 
外 ， 光 照 方程 还 涉及 一 些 其 他 的 参数 ， 如 表面 法 线 与 观 守 点 。 








2. 曲面 法 线 (surface normal) 是 一 种 正 交 于 曲面 上 某 点 切 平 面 的 
单位 向 量 。 利 用 曲面 法 线 可 确定 曲面 上 某 点 的 “ 朝 同 ”。 针 对 光照 计算 ， 
我 们 需要 求 出 三 角形 网 格 曲面 上 每 一 点 处 的 曲面 法 线 ， 以 此 来 确定 光线 
照射 到 网 格 表面 点 处 的 角度 。 为 了 获取 曲面 法 线 ， 我 们 仅 指 定 了 顶点 处 
的 表面 法 线 (vertex normal， 所 以 也 称 为 顶点 法 线 ) 。 接 下 来 ， 为 了 获 
取 三 角形 网 格 曲面 上 每 一 点 处 的 曲面 近似 法 线 ， 需 要 在 光栅 化 期 间 对 三 
角形 中 的 这 些 顶 点 法 线 进行 插值 。 对 于 任意 三 角形 网 格 来 说 ， 一 般 要 通 
过 一 种 叫 作 求法 线 平均 值 的 计算 方法 来 估算 顶点 法 线 。 如 采 和 窍 阵 4 可 用 
于 变换 点 与 向 量 〈 非 法 向 量 ) ， 那 么 (4 ) 便 可 用 于 变换 经 非 等 比 变换 
或 剪 切 变换 后 的 法 线 。 

















3. 平行 光源 (方向 光 〉 模拟 了 一 种 距 被 照 物体 极 远 的 光源 。 据 
此 ， 我 们 可 以 将 入 射 光线 看 作 是 彼此 平行 的 光线 。 方 同 光 的 一 个 现实 实 
例 是 太阳 向 地 球 发 射 的 光 。 扣 光 源 会 回 四 周 各 个 方 回 发 光 ， 它 的 一 个 现 
实 示例 是 电 人 灯泡。 聚光灯 光源 的 友 光 范围 是 圆锥 体 ， 实 际 生活 中 的 例子 


征 家 用 电 圳 手电 简 。 


4. 根据 菲 涅 耳 效 应 可 知 ， 当 光 到 达 两 种 不 同 折射 率 介 质 之 间 的 界 
面 时 ， 一 部 分 光 会 被 反射 ， 其 余 的 光 则 会 折射 入 介质 。 反 射 的 光量 依赖 
于 介质 《〈《 某 些 材质 的 反射 率 要 但 高 一 些 ) 以 及 法 同 量 n 与 光 同 量 LL 之 间 
的 夹 角 9i。 考 虑 到 这 个 过 程 的 复杂 性 ， 以 致 完整 的 菲 涅 耳 方程 一 般 不 会 
用 于 实时 泻 染 ， 而 是 采用 石 里 元 近似 (Schlick approximation) 加 以 代 
i 

















5. 现实 世界 中 的 反射 物体 一 般 不 是 理想 镜面 。 纵 然 一 个 物体 的 表 
面 看 起 来 十 分 平滑 ， 但 在 微观 水 平 上 来 看 它 还 是 有 一 定 的 粗 烙 度 
Croughness) 。 我 们 可 以 认为 理想 的 镜面 粗糙 度 为 0， 并 且 和 它 的 微观 表 
面 法 线 都 与 宏观 表面 法 线 指 癌 相同 的 方向 。 随 着 粗糙 度 的 增加 ， 微 观 表 
面 法 线 纷纷 俩 离 宏观 表面 法 线 ， 并 导致 反射 光 逐 渐 扩 展 为 借 面 波 


(specular lobe) 。 

















6. 环境 区 模 拟 了 在 场景 中 进行 多 次 散射 与 反弹 ， 并 且 按 各 个 方 同 
均等 射 问 物 体 的 间接 光 ， 因 此 它 提供 的 是 均匀 光照 。 慢 反射 光 模 拟 的 是 
进入 介质 内 部 的 光 ， 它 将 在 表面 下 进行 散 映 ， 其 中 的 一 部 分 会 被 吸收 ， 
而 剩 下 的 光 则 将 散射 回 表面 。 由 于 对 表面 下 的 散射 过 程 建 模 比 较 困 难 ， 
我 们 便 假 设 从 介质 返回 来 的 光 在 表面 上 光 的 入 射 点 处 辐 所 有 方 癌 均等 地 
散射 。 镜 面 光 则 模拟 了 根据 菲 涅 耳 效 应 与 表面 粗糙 度 而 从 表面 反射 的 
光 。 

















8.16 ”练习 


1. 修改 本 章 的 光照 演示 程序 ， 使 方 问 光源 仅 发 出 俩 红色 的 光 。 此 
外 ， 通 过 使 用 正弦 函数 令 光 的 强度 随时 间 函 数 而 有 规律 地 改变 ， 继 而 使 
光 按 脉冲 形式 (明了 瞳 渐变 ) 得 以 展现 。 利 用 带 有 特定 色彩 的 闪烁 光源 可 
以 很 好 地 演 桨 出 不 同 的 游戏 氛围 ， 例 如 ， 内 烁 的 红 光 可 用 于 表现 气氛 紧 
张 的 急救 场面 。 











2. 修改 本 章光 照 演 示 程 序 中 的 材质 粗糙 度 。 





3. 修改 前 一 章 中 的 “Shapes”《〈 多 种 不 同 的 几何 图 形 ) 演示 程序 ， 
回 其 添加 材质 以 及 三 点 布 光 〈three-point lighting， 也 译作 三 点 打 光 、 三 
点 光照 等 ) 系统 。 三 点 布 光 系统 常用 于 电影 与 摄影 工作 ， 它 可 以 提供 比 
单 光源 更 佳 的 光照 效果 。 该 系统 由 三 种 光源 构成 ， 即 称 为 主 光 〈key 
light〉 的 主要 光源 、 通 常 在 主 光 的 侧面 对 准 目 标的 辅助 光 fil light， 也 
称 补 光 〉 以 及 轮 慷 光 (back light， 又 称 背 光 ) 。 我 们 用 三 点 布 光 的 方式 
充当 间接 光照 ， 可 以 比 仅 使 用 构成 间接 光照 的 环境 光 更 好 地 诠释 目标 对 
象 。 在 本 示例 中 ， 请 用 3 个 方向 光 来 构建 三 点 布 光 系 统 ， 见 图 8.29。 














图 8.29 ”练习 3 解答 方案 的 效果 


4. 通过 撤去 三 点 布 光 ， 并 在 每 个 柱子 上 的 球体 中 心 添加 一 个 点 光 
源 来 修改 练习 3 的 解决 方案 。 


5， 移 除 三 点 布 光 系统 ， 通 过 向 每 个 柱子 上 球体 的 中 心 添加 一 个 聚 
光 灯 光源 ， pm 





6. 卡通 风格 光照 的 一 个 特点 是 颜色 之 间 的 过 渡 比 较 突 几 〈 与 大 家 
通常 喜闻乐见 的 平滑 渐变 刚好 相反 ) ， 从 而 塑造 夸张 的 效果 ， 如 图 8.30 
所 示 。 这 种 光照 一 般 可 以 通过 计算 ha 与 来 得 以 实现 ， 但 是 在 像素 着 色 
器 中 使 用 这 种 光照 之 前 ， 先 要 运用 下 列 离散 函数 对 这 两 个 参数 进行 变 
换 : 











04 当 -co< 总 所 0 时 
06 当 00< 六 所 0 列 j 
10 当 05<i 过 1.08 
00 当 00< 志 0.1 时 
05 当 01< 过 0 明寺 
08 当 08< 六 所 10 时 


= 了 (5) = 





GE = gtk,)= 








请 用 这 种 卡通 着 色 的 方式 来 修改 本 章 的 光照 演示 程序 。〈 注 意 ， 上 


函数 /与 9 只 是 便于 上 手 的 示例 函数 ， 我 们 可 以 根据 预期 的 We 
| max (72 . 到 .0) ,LL-:n> 
调整 。 其 中 ，Aa = Inax( 工 :7m;0)， 0, L:ng0 .) 再 将 
与 h 代 回 式 8.4 即 可 求 出 光照 的 颜色 值 。 其 实 关 键 点 就 在 于 函数 /与 9， 


它们 将 原本 的 渐变 过 程 减少 为 上 述 的 奉 干 种 组 合 。 
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图 8.30 ”卡通 光照 效果 的 效果 截图 





[1] normalize 即 规范 化 之 意 。 在 代码 中 与 之 对 应 的 是 HLSL 中 的 内 置 规 
范 化 函数 normalize。 


[2] 即 cdamp， 该 词 常用 于 电子 学 中 ， 此 处 引申 为 将 茶 值 限制 特定 范围 
之 内 ， 也 有 译作 截断 。 


[3] 要 计算 出 真实 的 光照 效果 ， 要 以 现实 世界 中 的 物理 为 基础 展开 讨 
论 。 光 具有 波 粒 二 象 性 ， 因 而 可 由 此 展开 。 根 据 文中 的 所 用 词汇 可 知 


辐射 通 量 ) ， 本 书 是 以 辐 《〈 射 ) 度 学 的 角度 来 前 述 光 照 的 。 就 像 其 他 
表示 光量 的 因素 一 样 ， 漫 反射 反照 率 最 终 反 映 的 其 实 是 种 颜色 ， 并 在 程 
序 中 以 一 个 计算 项 的 号 份 参与 光照 的 计算 。 而 计算 光照 也 就 是 计算 最 终 
显示 出 来 的 颜色 。 








第 9 章 ”纹理 贴图 





我 们 的 演示 程序 开始 变 得 越发 有 趣 了 ， 但 是 ， 这 现实 世界 中 的 物体 
往往 却 要 比 物体 常量 缓冲 区 中 可 捕获 的 材质 有 着 更 加 丰富 的 细节 。 纹 理 
由 图 (texture mapping， 也 译作 纹理 映射 ) 就 是 这 样 一 种 将 图 像 数 据 映 
射 到 网 格 三 角形 上 的 技术 ， 可 以 使 我 们 为 场景 增添 更 多 的 细节 ， 令 它 更 
有 具 真实 感 。 例 如 ， 我 们 可 以 构建 一 个 立方 体 ， 再 将 板 条 箱 的 纹理 映射 到 
它 的 每 个 面 上 ， 使 它 看 起 来 像 个 木质 的 货物 箱 〈 见 图 9.1) 。 








图 9.1 ”以 映射 有 板 条 箱 纹理 的 立方 体 创建 的 货物 箱 例 程 


学 习 目 标 : 


1. 学习 如 何 将 局 部 纹理 映射 到 网 格 三 角形 上 。 


.探究 如 何 创 建 和 局 用 纹理 。 





， 学 会 如 何 通过 纹理 过 滤 来 创建 更 为 平滑 的 图 像 效 果 。 


， 探 索 如 何 用 寻 址 模式 来 进行 多 次 贴图 。 





， 探究 如 何 将 多 个 纹理 进行 组 合 ， 从 而 创建 出 新 的 纹理 与 特效 。 


.学习 如 何 通过 纹理 动画 来 创建 一 些 基 本 效果 。 


9.1 纹理 与 资源 的 回顾 


回顾 前 文 可 知 ， 其 实 我 们 自 第 4 章 起 就 已 经 开始 使 用 纹理 了 。 特 别 
是 深度 缓冲 区 与 后 台 绥 冲 区 ， 它 们 都 是 通过 ID3D12Resource 接 口 表 
示 ， 并 以 D3D12_RESOURCE_DESC: :Dimension 成 员 中 的 
D3D12_RESOURCE_DIMENSION TEXTURE2D 类 型 来 描述 的 2D 纹 理 对 象 。 
为 了 便于 参考 ， 在 本 节 中 ， 我 们 先 来 重 温 在 第 4 章 里 已 经 讨论 过 的 与 纹 
理 相 关 的 知识 。 








2D 纹 理 是 一 种 由 特定 数据 元 素 所 构成 的 矩阵 出 ， 它 的 用 处 之 一 即 是 
存储 2D 图 像 数 据 ， 纹 理 中 的 每 个 元 素 都 存储 着 对 应 像素 的 颜色 。 但 
是 ， 这 并 不 是 它 唯 一 的 用 途 ， 比 如 说 ， 在 一 种 称 为 法 线 贴图 的 高 级 技术 
中 ， 每 个 纹理 元 素 都 存储 的 是 一 个 3D 向 量 而 非 颜色 数据 。 因 而 ， 尽 管 
一 提 及 纹理 给 人 的 第 一 印象 是 用 以 存储 图 像 数据 的 资源 ， 但 实际 上 和 它 具 
有 更 广泛 的 用 处 。1D 纹 理 
(D3D12_RESOURCE_DIMENSION_TEXTURE1D) 与 3D 纹 理 
(D3D12_RESOURCE_DIMENSION_TEXTURE3D) 就 像 由 数据 元 素 构成 的 
1D、3D 数 组 。 而 1D、2D 以 及 3D 纹 理 实则 都 用 泛 型 接口 
ID3D12Resource 来 表示 。 











纹理 不 同 于 缓冲 区 资源 ， 因 为 缓冲 区 资源 仅 存 储 数据 数组 ， 而 纹理 
却 可 以 具有 多 个 mipmap 层 级 《后 文 有 介绍 ) ，GPU 会 基于 这 个 层级 进 
行 相应 的 特殊 操作 ， 例 如 运用 过 滤器 以 及 多 重 采 样 。 文 持 这 些 特殊 操作 
纹理 的 资源 都 被 限定 为 一 些 特定 的 数据 格式 。 而 缓冲 区 资源 就 没有 这 项 


限制 ， 它 们 可 以 存储 任意 类 型 的 数据 。 纹 理 所 支 持 的 数据 格式 由 枚 举 类 
型 DXGI_FORMAT 来 表示 。 这 是 其 中 的 一 些 格式 示例 : 


1. DXGI_FORMAT_R32G32B32_FLOAT: 每 个 元 素 由 3 个 32 位 浮 点 数 
分 量 构成 。 

2. DXGI_FORMAT_R16G16B16A16_UNORM: 每 个 元 素 由 4 个 16 位 分 
量 组 成 ， 每 个 分 量 都 将 被 映射 到 范围 [0, 1] 之 间 。 

3. DXGI_FORMAT_R32G32_UINT: 每 个 元 素 由 2 个 32 位 无 符号 整数 
分 量 构成 。 

4. DXGI_FORMAT_R8G8B8A8_UNORM: 每 个 元 素 由 4 个 8 位 无 符号 分 


量 构成 ， 每 个 分 量 都 将 被 映射 到 范围 [0, 1] 之 间 。 


5. DXGI_FORMAT_R8G8B8A8_SNORM: 每 个 元 素 由 4 个 8 位 有 符号 分 
量 构成 ， 每 个 分 量 都 将 被 映射 到 范围 [-1, 1] 之 间 。 


6. DXGI_FORMAT_R8G8B8A8_SINT: 每 个 元 素 由 4 个 8 位 有 符号 整 
数 分 量 构成 ， 每 个 分 量 都 将 被 映射 到 范围 [-128, 127] 之 间 。 


7. DXGI_FORMAT_R8G8B8A8_UINT: 每 个 元 素 由 4 个 8 位 无 符号 整 


数 分 量 构成 ， 每 个 分 量 都 将 被 映射 到 范围 [0, 255] 之 间 。 


顾名思义 ，R、G、B、A 这 4 个 字母 分 别 用 于 表示 红色 、 绿 色 、 蓝 
色 以 及 alpha 值 。 然 而 ， 正 如 前 面 所 说 ， 纹 理 不 一 定 要 存储 颜色 信息 。 例 
如 ， 格 式 





DXGI_FORMAT_R32G32B32_FLOAT 


具有 3 个 浮 点 数 分 量 ， 因 此 它 能 够 存储 一 个 3D 向 量 的 浮 点 坐标 《并 
不 是 颜色 向 量 ) 。 还 有 一 种 无 类 型 〈typeless) 格式 ， 我 们 仅 用 它 来 预 
留 一 块 内 存 ， 并 要 在 稍 后 将 纹理 绑 定 到 演 染 流水 线 的 时 候 指出 如 何 重新 
解释 其 中 的 数据 (有 点 像 类 型 强制 转换 ) 。 例 如 ， 下 列 无 类 型 格式 就 为 
每 个 元 素 预 留 了 4 个 8 位 分 量 ,， 但 是 并 没有 指定 其 具体 的 数据 类 型 (如 整 
数 、 浮 点 数 、 无 符号 整数 等 ) : 


DXGI_FORMAT_R8G8B8A8_TYPELESS 





注意 Note NW 


DirectX 11 SDK 文 档 中 提 人 a 到: “以 某 种 具体 类 型 创建 的 资源 ， 其 格式 
是 不 能 更 改 的 。 这 将 使 该 资源 在 运行 时 的 访问 得 以 优化 [..…..]。” 因 
此 ， 我 们 应 当 只 在 不 得 已 的 情况 下 才 使 用 无 类 型 资源 ， 否 则 就 用 具体 的 
类 型 来 创建 资源 。 


一 个 纹理 可 以 绑 定 到 泻 染 流水 线 的 不 同 阶段 ， 一 个 常见 的 例子 是 既 
可 将 一 纹理 用 作 演 染 目标 〈 即 Direct3D 中 的 泻 染 到 纹理 技术 ) ， 又 能 把 
它 作为 着 色 器 资源 〈 即 在 着 色 器 中 对 该 纹理 进行 采样 ) 。 一 个 纹理 可 以 
当 作 渲染 目标 ， 也 可 以 充当 着 色 器 资源 ， 但 是 不 能 同时 “ 身 兼 数 职 "。 将 
数据 浑 染 到 一 个 纹理 后 ， 再 用 它 作 为 着 色 器 资源 ， 这 种 方法 称 为 泻 染 到 


纹理 〈render-to-texture) ， 本 书 的 后 面 会 用 此 技术 来 实现 一 些 有 趣 的 特 
效 。 要 使 纹理 扮演 泻 染 目标 与 着 色 器 资源 这 两 种 和 角色， 我 们 就 需要 为 此 
纹理 资源 创建 两 个 描述 符 ， 一 个 存 于 泻 染 目标 堆 中 以 
D3D12_DESCRIPTOR_HEAP_TYPE_RTV 描 述 ) ， 另 一 个 位 于 着 色 器 资源 
堆 中 (以 D3D12_DESCRIPTOR_HEAP_TYPE_CBV_SRV_UAV 描 述 。 注 意 ， 
从 着 色 器 资源 堆 的 枚 举 名 称 中 能 够 看 出 ， 它 也 可 以 存储 常量 缓冲 区 视图 
描述 符 以 及 无 序 访问 视图 描述 符 ) 。 接 下 来 ， 我 们 便 可 以 把 该 资源 绑 定 
为 演 染 目标 ， 或 者 作为 着 色 器 的 输入 与 根 签名 中 的 根 参 数 相 绑 定 〈 当 
然 ， 这 两 种 喘 份 并 不 能 同时 共存 〉: 


// 绑 定 为 泻 染 目标 

CD3DX12 CPU DESCRIPTOR HANDLE rtv = ...; 

CD3DX12 CPU DESCRIPTOR HANDLE dsv = ...; 
cmdList->OMSetRenderTargets(1, &rtv, true, &dsv); 


// 以 着 色 器 输入 的 名 义 绑 定 到 根 参 数 
CD3DX12_GPU_DESCRIPTOR_HANDLE tex = ...; 
cmdList->SetGraphicsRootDescriptorTable(rootPparamIndex, tex); 








资源 描述 符 实 际 上 做 了 两 件 事 : 它们 通知 Direct3D 这 些 资 源 将 被 如 
何 使 用 《〈“ 即 我 们 将 资源 绑 定 到 流水 线 的 哪个 阶段 } 。 如 果 以 无 类 型 格式 
来 创建 资源 ， 那 么 我 们 一 定 要 在 为 它 创 建 视图 时 指定 其 具体 类 型 。 这 样 
一 来 ， 大 使 用 了 无 类 型 格式 ， 我 们 就 能 在 茶 个 流水 线 阶 段 中 将 纹理 的 元 
素 视 为 浮 点 值 ， 而 在 男 一 流水 线 步 又 中 将 该 纹理 的 元 素 视 为 整数 ， 这 一 
过 程 其 实 就 相当 于 对 数据 进行 强制 转换 。 





在 本 章 中 ， 我 们 只 探讨 将 纹理 绑 定 为 着 色 器 资源 ， 气 此 ， 像 素 着 色 
髓 就 能 对 纹理 进行 采样 并 处 理 其 中 表示 颜色 的 像素 数据 。 


9.2 ”纹理 坐标 


Direct3D 上 所 采用 的 纹理 坐标 系 ， 是 由 指向 图 像 水 平 正 方向 的 v 轴 与 
指向 图 像 垂 直 正 方向 的 o 轴 所 组 成 的 。 取 值 范 围 为 90 wv < 1 的 坐标 ( U 
标定 的 是 一 种 称 为 纹 素 (texel) 的 纹理 元 素 。 观 察 图 9.2 可 以 发 现 ，* 轴 
的 正方 向 指向 图 像 的 * 正 下 ?” 方 。 此 外 ， 还 可 以 看 出 纹理 坐标 采用 的 是 归 
一 化 坐标 区 间 [0, 1]， 通 过 这 种 方式 便 可 令 Direct3D 的 工作 摆脱 具体 纹理 
尺寸 的 干扰 。 例 如 ， 无 论 纹 理 实际 的 大 小 是 256 x 256 像 素 、512 x 1024 像 
素 还 是 2048 x 2048 像 素 ， 纹 理 坐 标 (0.5, 0.5) 总 是 表示 纹理 正中 间 的 纹 
素 ; 坐标 (0.25, 0.75) 总 是 表示 在 纹理 中 ， 位 于 水 平方 向 总 宽度 1/4、 垂 直 
方向 总 高 度 3/4 处 的 纹 素 。 目 前 所 讨论 的 纹理 坐标 都 是 在 区 间 [0, 1] 之 
内 ， 在 后 面 ， 我 们 会 解释 各 超出 了 此 范围 会 发 生 什 么 。 

















图 9.2 ”图 中 所 示 的 是 纹理 坐标 系 ， 











有 时 也 被 称 为 纹理 空间 [2 








对 于 每 个 3D 三 角形 来 说 ， 我 们 希望 在 将 要 映射 于 其 上 的 纹理 中 定 
义 出 与 之 对 应 的 三 角形 ( 见 图 9.3)。 设 Po、Pil 以 及 Py 为 3D 三 角形 的 3 个 
顶点 ， 它 们 分 别 对 应 于 纹理 坐标 9o、91 与 92。 针 对 3D 三 角形 上 任意 一 点 
(zy, 2) 处 的 纹理 坐标 (w+*)， 我 们 都 可 以 通过 与 3D 三 角形 坐标 插值 所 用 的 
相同 参数 ;、t， 对 顶点 纹理 坐标 进行 线性 插值 来 求 得 。 这 就 是 说 ， 如 
果 : 








D1 = (X1,y1,21) 


全 = (u,v01) 9g2 = (2,72) 





P2 = (x2, y2,22) 





SC — qo) 


Do = (Xo, y0, 20) 9o =|(wo, vo) 


3D 三 角形 对 应 的 纹理 三 角形 











图 9.3 左 侧 的 三 角形 位 于 3D 空 间 ， 我 们 将 把 右 侧 纹理 上 的 2D 三 角形 映射 到 左 侧 的 3D 三 角形 上 











(7,Yy,2) = Pp = Do t+ s(p1 — Po) + t(p2 — Po) 
当 s>0t>0s+t 志 1 时 ， 那 么 ， 
(u,v)= gq= qo+s(qi— qo)+t(q2 一 90) 
依 此 方法 便 可 求 出 三 角形 上 每 个 点 处 的 对 应 纹理 坐标 。 
为 了 实现 此 计算 过 程 ， 我 们 需要 再 次 修改 顶点 结构 体 ， 为 它 添加 一 
个 纹理 坐标 以 标识 纹理 上 的 点 。 此 时 ， 每 个 3D 顶 点 就 有 了 与 之 对 应 的 


2D 纹 理 顶 点 。 这 样 一 来 ， 用 于 定义 3D 三 角形 的 3 个 顶点 ， 也 在 纹理 坐标 
系 中 定义 了 一 个 2D 三 角形 《〈 即 我 们 要 为 每 个 3D 三 角形 关联 一 个 2D 纹 


于 3 


struct Vertex 


{ 
DirectX: :XMFLOAT3 Pos; 
DirectX: :XMFLOAT3 Normal; 
DirectX: :XMFLOAT2 TexC; 


了 


std: :vector<D3D12 INPUT_ELEMENT_DESC> mInputLayout = 


{ "POSITION", 0, DXGI_ FORMAT_ R32G32B32_FLOAT, 606, 90, 
D3D12_INPUT_CLASSIFICATION PER VERTEX_ DATA, 0 }, 
{ "NORMAL", 60, DXGI_ FORMAT R32G32B32_FLOAT, 868，12,，, 
D3D12_INPUT_CLASSIFICATION PER VERTEX_ DATA, 0 }, 
{ "TEXCOORD", 60, DXGI_ FORMAT_ R32G32_ FLOAT, 686，24，, 
D3D12_INPUT_CLASSIFICATION PER VERTEX_ DATA, 0 }, 





}; 


我 们 也 可 以 创建 与 3D 三 角形 在 形状 上 有 较 大 差异 的 2D 纹 理 三 角形 
来 进行 “特殊 ”的 纹理 贴图 。 如 此 一 来 ， 在 2D 纹 理 映 射 到 3D 三 角形 的 过 
程 中 ， 所 产生 的 拉 伸 与 扭曲 现象 会 令 贴图 的 效果 看 上 去 不 那么 尽 如 人 
意 。 例 如 ， 将 一 个 锐角 三 角形 映射 到 一 个 直角 三 角形 的 时 候 就 需要 进行 
上 述 的 拉 伸 操作 。 一 般 来 讲 ， 应 尽量 避免 使 纹理 受到 扭曲 ， 除 非 贴 图 师 
(texture artist) 硕 望 获得 拉 伸 的 效果 ， 故 意 而 为 之 。 





在 图 9.3 中 ， 我 们 将 纹理 图 像 一 丝 不 差 地 映射 到 了 立方 体 的 每 一 个 
表面 之 上 。 然 而 这 并 不 是 唯一 的 选择 我们 可 以 只 同 几 何 体 映射 部 分 纹 





理 。 事 实 上 ， 我 们 也 能 够 将 几 个 并 无 关联 的 图 像 合 为 一 个 大 的 纹理 图 
(这 被 称 为 纹理 图 集 ，texture atlas) ， 再 将 它 应 用 于 若干 不 同 的 物体 
〈 见 图 9.4) 。 此 时 ， 纹 理 坐 标 将 用 于 确定 纹理 的 哪 一 部 分 将 被 映射 到 
目标 三 角形 上 。 





图 9.4 图 中 的 纹理 图 集 用 一 个 大 纹理 存储 了 4 种 子 纹理 。 此 时 ， 要 通过 为 每 个 顶点 所 设置 的 
纹理 坐标 来 确定 将 要 映射 到 目标 几何 体 上 的 局 部 纹理 


9.3 ”纹理 数据 源 


贴图 师 通 常会 借助 Photoshop 或 一 些 其 他 的 图 像 编辑 器 为 游戏 制作 
纹理 ， 最 后 再 将 它们 保存 为 菜 种 格式 的 图 像 文件 ， 如 BMP、DDS、TGA 
或 PNG 等 。 随 后 ， 游 戏 应 用 程序 会 在 加 载 期 间 将 图 像 文 件 载 
入 ID3D12Resource 对 象 。 对 于 实时 图 形 应 用 程序 来 说 ，DDS 图 像 文 件 
格式 (DirectDraw 图 面 格式 ，DirectDraw Surface format，DDS) 是 一 种 
尚 佳 的 选择 : 除了 文 持 GPU 可 原生 处 理 的 各 种 图 像 格式 ， 它 还 文 持 一 些 
GPU 上 自 喘 就 可 解压 的 压缩 图 像 格式 。 








注 意 Note i 


贴图 师 们 不 宜 将 DDS 格 式 当 作 工 作 过 程 中 所 用 的 图 像 格 式 ， 而 是 应 
当 用 他 们 认为 更 加 顺手 的 格式 来 保存 工作 进程 。 待 纹理 最 终 完成 后 ， 再 
为 游戏 应 用 程序 把 它 导出 为 DDS 格 式 。 








9.3.1 DDS 格 式 概 述 


DDS 对 于 3D 图 形 来 说 是 一 种 理想 的 格式 ， 因 为 它 支 持 一 些 专用 于 
3D 图 形 的 特殊 格式 以 及 纹理 类 型 。 从 本 质 上 来 讲 ， 它 实 为 一 种 针对 
GPU 而 专门 设计 的 图 像 格式 。 例 如 ，DDS 纹 理 满 足 用 于 3D 图 形 开 发 的 


以 下 特征 : 
1. mipmap。 
2. GPU 能 自行 解压 的 压缩 格式 。 
3. 纹理 数组 。 
4. 立方 体 图 (cube map， 也 有 译作 立方 体贴 图 ) 。 
5. 体 纹理 (volume texture， 也 有 译作 体积 纹理 、 立 体 纹理 等 ) 。 


DDS 格 式 能 够 文 援 不 同 的 像素 格式 。 像 素 格 式 由 枚 举 类 型 
DXGI_FORMAT 中 的 成 员 来 表示 ， 但 是 并 非 所 有 的 格式 都 适用 于 DDS 纹 
理 。 非 压缩 图 像 数据 一 般 会 采用 下 列 格式 。 





1.DXGI_FORMAT_B8G8R8A8_UNORM 
或 DXGI_FORMAT_B8G8R8X8_UNORM: 适用 于 低 动态 范围 (low-dynamic- 
range) 图 像 。 


2.DXGI_FORMAT_R16G16B16A16_FLOAT: 适用 于 高 动态 范围 
Chigh-dynamic-range) 图 像 。 





随 着 虚拟 场景 中 纹理 数量 的 大 幅 增 长 ， 对 GPU 闹 显存 的 需求 也 在 迅 
速 增加 (还 记得 吗 ， 我 们 需要 将 所 有 的 纹理 都 置 于 显存 当中 ， 以 便 在 程 
序 中 快速 地 运用 这 些 资 源 ) 。 为 了 绥 解 这 些 内 存 的 需求 压力 ，Direct3D 
文 持 下 列 几 种 压缩 纹理 格式 〈 也 称 作 块 压 缩 ，block compression ) 。 








1. BC1 (CDXGI_FORMAT_BC1_UNORM) : 如 果 我 们 需要 将 图 片 压 缩 
为 支持 3 个 颜色 通道 和 仅 有 1 位 〈 开 / 关 ) alpha 分 量 的 格式 ， 则 使 用 此 格 
起 5 





2. BC2 (DXGI_FORMAT_BC2_UNORM) : 如 果 我 们 需要 将 图 片 压缩 
为 支持 3 个 颜色 通道 和 仅 有 4 位 alpha 分 量 的 格式 ， 则 应 用 此 格式 。 





3. BC3 (DXGI_FORMAT_BC3_UNORM) : 如 果 我 们 需要 将 图 片 压缩 
为 支持 3 个 颜色 通道 和 8 位 alpha 分 量 的 格式 ， 则 采用 此 格式 。 





4. BC4 (DXGI_FORMAT_BC4_UNORM) : 如 果 我 们 需要 将 图 片 压 缩 
为 仅 含 有 1 个 颜色 通道 的 格式 〈 如 灰 度 图 像 ) ， 则 运用 此 格式 。 





5. BC5 (CDXGI_FORMAT_BC5_UNORM) : 如 果 我 们 需要 将 图 片 压缩 
为 只 支持 2 个 颜色 通道 的 格式 ， 则 使 用 此 格式 。 





6. BC6 (DXGI_FORMAT_BC6H_UF16) : 如 果 我 们 需要 将 图 片 压缩 
为 HDR (高 动态 范围 ) 图 像 数 据 ， 则 应 用 此 格式 。 


7. BC7 (DXGI_FORMAT_BC7_UNORM)〉 : 此 格式 用 于 对 RGBA 数 据 
进行 高 质量 的 压缩 。 特 别 是 ， 此 格式 可 极 大 地 减少 因 压 缩 法 线 图 而 造成 
的 误差 。 


2 


经 压缩 后 的 纹理 只 能 用 于 输入 到 演 染 流水 线 中 的 着 色 器 阶段 ， 而 不 
能 作为 泻 染 目标 。 


由 于 块 压缩 算法 (block compression algorithm ) 要 以 4 x 4 的 像素 块 
为 基础 进行 处 理 ， 所 以 纹理 的 尺寸 必须 为 4 的 倍数 。 


再 次 重申 ， 这 些 格式 的 优点 是 可 以 使 图 像 以 压缩 的 形式 存 于 显存 之 
中 ， 而 在 需要 时 ，GPU 便 能 动态 地 对 它们 进行 解压 。 将 纹理 压缩 为 DDS 
文件 还 有 另 一 个 好 处 ， 即 更 节省 硬盘 空间 。 


9.3.2 创建 DDS 文 件 
如 果 身 为 图 形 方面 的 编程 新 手 ， 可 能 会 对 DDS 比 较 陌生 ， 因 此 会 更 


多 地 使 用 如 BMP、TGA 或 PNG 这 样 的 图 像 格 式 。 下 面 介绍 两 种 可 以 将 传 
统 图 像 格式 转换 为 DDS 格 式 的 方法 。 





1. NVIDIA 公 司 为 Adobe Photoshop 提 供 了 一 款 可 以 将 图 像 导出 为 
DDS 格 式 的 插件 。 该 插件 现存 于 https://developer.nvidia.com/nvidia- 
texture-tools-adobe-photoshop。 此 插件 还 有 一 些 其 他 选项 ， 可 供用 户 指 


定 DDS 文 件 的 DXGI_FORMAT 格 式 ， 或 生成 mipmap 等 。 


2. 微软 公司 提供 了 一 个 名 为 texconv 的 命令 行 工具 ， 该 工具 能 将 传 
统 的 图 像 格式 转换 为 DDS 文 件 。 男 外 ，tezconv 程 序 还 有 更 多 的 其 他 功 
能 ， 如 调整 图 像 大 小 、 改 变 像 系 格 式 、 生 成 mipmap 等 。 可 以 在 网 站 
https://directxtex.codeplex.com/wikipage?title=Texconv&referringTitle= 


ocumentation 找 到 它 的 文档 与 下 载 链接 。 





下 面 的 示例 展示 了 同 tezrconv 程 序 输入 一 个 BMP 文 件 bricks.bmp， 并 
通过 它 来 输出 格式 为 BC3_UNORM 且 具有 一 个 mipmap 链 《〈 链 中 共有 10 个 
mipmap) 的 DDS 文 件 bricks.dds。 


texconv -m 16 -f BC3 UNORM bricks.bmp 


注意 Note We 


微软 公司 还 提供 了 男 一 个 名 为 terassemble 的 命令 行 工具 ， 该 工具 常 
被 用 于 创建 存 有 纹理 数组 、 体 纹理 或 立方 体 图 的 DDS 文 件 。 本 书 的 后 面 
会 用 到 此 工具 里 |。 


注意 Note i 


Visual Studio 2015 中 内 置 了 一 个 支持 DDS 以 及 其 他 和 常见 格式 的 内 置 
图 像 编 辑 器 。 我 们 可 以 将 图 片 拖 入 Visual Studio 2015， 它 便 会 自动 用 此 
编辑 器 将 图 像 打开 。 对 于 DDS 文 件 而 言 ， 我 们 可 以 在 此 编辑 器 中 碍 看 
mipmap 层 级 、 修 改 DDS 格 式 以 及 考察 各 种 颜色 通道 等 信息 。 


9.4 ”创建 以 及 局 用 纹理 


9.4.1 加载 DDS 文 件 


微软 公司 提供 了 一 组 用 来 加 载 DDS 文 件 的 轻 量 级 源 代码 。 


但 是 ， 在 写 下 这 段 话 的 时 候 ， 此 代码 仅 支 持 DirectX 11 册 。 我 们 在 
此 修改 了 DDSTextureLoader.h/cpp 文 件 ， 专 为 DirectX 12 提 供 了 一 个 新 加 
的 读 取 DDS 文 件 的 方法 〈 这 两 个 已 修改 的 文件 可 以 在 DVD 或 供 读者 下 载 
的 源 文件 中 的 Common 文 件 夹 内 找到 ) 。 

HRESULT DirectX::CreateDDSTextureFromFile12( 


_In_ ID3D1i2Device* device， 
_In_ ID3D1i2GraphicsCommandList* cmdList， 


_In z_ const wchar t* szFileName, 
_Out Microsoft::WRL::Comptr<ID3D12Resource>& texture, 
_Out Microsoft::WRL::Comptr<ID3D12Resource>& textureUploadHeap); 





1. device: 指向 用 于 创建 纹理 资源 的 D3D 设 备 的 指针 。 


2. cmdList: 提交 GPU 命令 〈 例 如 ， 将 纹理 数据 从 上 传 堆 复制 到 
默认 堆 的 命令 ) 的 命令 列表 。 


3. szFileName: 欲 加 载 的 图 像 文件 名 。 
4. texture: 返回 载 有 图 像 数据 的 纹理 资源 。 


5. textureUploadHeap: 返回 的 纹理 资源 ， 在 此 ， 将 它 当 作 一 个 


上 传 堆 ， 用 于 将 图 像 数据 复 制 到 默认 堆 中 的 纹理 资源 。 在 GPU 完成 其 上 
述 复制 命令 之 前 ， 不 能 销毁 该 资源 。 


为 了 用 名 为 WoodCreate01.dds 的 图 像 来 创建 一 个 对 应 的 纹理 ， 应 按 
照 如 下 方式 编写 代码 : 


struct Texture 


{ 














// 为 了 便于 查找 而 所 用 的 唯一 材质 名 


std::string Name; 

















std: :wstring Filename; 


Microsoft: :WRL: :Comptr<ID3D1i2Resource> Resource = nullptr; 
Microsoft: :WRL: :Comptr<ID3D12Resource> UploadHeap = nullptr; 


}; 


auto woodCrateTex = std::make unique<Texture>(); 
woodCrateTex->Name = "WwoodCrateTex"; 
woodCrateTex->Filename = L"Textures/WoodCrate@81 .dds"; 
ThrowIfFailed(DirectX::CreateDDSTextureFromFile12( 
md3dDevice.Get(), mCommandList .Get(), 
woodCrateTex->Filename.c_str(), 
woodCrateTex->Resource, woodCrateTex->UploadHeap)); 





9.4.2 着色 器 资源 视图 堆 


创建 了 纹理 资源 后 ， 我 们 还 需要 为 它 再 创建 一 个 SRV (着色 器 资源 
视图 ) 描述 符 ， 并 将 其 设置 到 一 个 根 签名 参数 槽 (root signature 
parameter slot) ， 以 供 着 色 堪 程序 使 用 。 为 此 ， 首 先 要 
用 ID3D12Device:: CreateDescriptorHeap 函 数 来 创建 描述 符 推 ， 
借 此 存储 SRV 描 述 符 。 下 面 的 代码 构建 了 一 个 可 容纳 3 个 类 型 为 CBV、 
SRV 或 UAV 描 述 符 的 描述 符 堆 ， 并 使 之 在 着 色 器 中 可 见 〈 即 可 供 着 色 器 


使 用 ) 


D3D12_DESCRIPTOR_HEAP_DESC srvHeapDesc = {}; 
srvHeapDesc.NumDescriptors = 3; 
srvHeapDesc.Type = D3D12 DESCRIPTOR HEAP_TYPE_CBV_SRV_UAV; 


srvHeapDesc.Flags = D3D12 DESCRIPTOR HEAP_ FLAG SHADER VISIBLE; 
ThrowIfFailed(md3dDevice->CreateDescriptorHeap( 
&srvHeapDesc, IID PPV_ARGS(&mSrvDescriptorHeap))); 





9.4.3 ”创建 着 色 器 资源 视图 描述 符 


一 旦 创建 了 SRV 堆 ， 便 可 创建 真正 的 描述 符 。 我 们 通过 填写 
D3D12_ SHADER_RESOURCE_VIEN_DESC 对 象 来 描述 SRV 描 述 符 ， 该 结构 
体 详 述 了 资源 的 类 型 以 及 其 他 的 信息 ， 如 格式 、 维 数 、mipmap 数 量 


要 
等 。 





typedef struct D3D12_SHADER_RESOURCE_VIEW_DESC 
{ 

DXGI_ FORMAT Format; 

D3D12_ SRV_DIMENSION ViewDimension; 

UINT Shader4ComponentMapping; 

union 


{ 


D3D12_ BUFFER_SRV Buffer; 
D3D12_ TEX1D SRV Texture1D; 
D3D12 TEX1D ARRAY SRV TexturelDArray; 
D3D12 TEX2D_SRV Texture2D; 
D3D12 TEX2D ARRAY_SRV Texture2DArray ; 
D3D12 TEX2DMS_SRV Texture2DMS; 
D3D12_ TEX2DMS_ ARRAY_SRV Texture2DMSArray; 
D3D12_ TEX3D_SRV Texture3D; 
D3D12 TEXCUBE_SRV TextureCube; 
D3D12_TEXCUBE_ARRAY_SRV TextureCubeArray; 
}; 
} D3D12 SHADER_ RESOURCE VIEW_DESC; 


typedef struct D3D12 TEX2D_SRV 
{ 


UINT MostDetailedMip; 

UINT MipLevels ; 

UINT PlaneSlice; 

FLOAT ResourceMinLODC1Lamp 
} D3D12 TEX2D_SRV; 





对 于 2D 纹 理 来 说 ， 我 们 只 关心 联合 体 中 的 D3D12_TEX2D_SRV 部 


1. Format: 视图 的 格式 。 如 果 待 创建 视图 的 资源 有 具体 的 格式 ， 
即 并 非 以 无 类 型 (typeless) 的 格式 创建 而 成 ) ， 就 用 此 资源 的 
DXGI_FORMAT 格 式 来 填写 此 参数 。 如 果 是 通过 无 类 型 的 DXGI_FORMAT 来 
创建 该 资源 的 ， 则 一 定 要 在 此 为 视图 填写 具体 的 类 型 ， 只 有 这 样 GPU 才 
能 知道 怎样 解释 并 处 理 这 一 数据 。 


2. ViewDimension: 资源 的 维 数 。 目 前 我 们 只 使 用 2D 纹 理 ， 所 以 
将 此 参数 指定 为 D3D12_SRV_DIMENSION TEXTURE2D。 以 下 是 几 种 常见 
的 纹理 维 数 : 


(a) D3D12_SRV_DIMENSION_TEXTURE1D: 资源 为 1D 纹 理 。 
(b) D3D12_SRV_DIMENSION_TEXTURE3D: 资源 为 3D 纹 理 。 


(c) D3D12_SRV_DIMENSION_TEXTURECUBE: 资源 为 立方 体 纹理 


(cube texture ) 。 


Z] 一 v7 


3. Shader4ComponentMapping: 在 着 色 器 中 对 纹理 进行 采样 时 ， 
它 将 返回 特定 纹理 坐标 处 的 纹理 数据 向 量 。 这 个 字段 提供 了 一 种 方法 ， 
可 以 将 采样 时 所 返回 的 纹理 向 量 中 的 分 量 进 行 重 新 排序 。 例 如 ， 可 以 用 





此 字段 将 红色 分 量 与 绿色 分 量 互 换 。 该 方法 常用 于 一 些 特 殊 的 场合 ， 但 
本 书 中 并 不 涉及 这 些 情景 。 因 此 ， 只 要 将 它 指定 

为 D3D12_DEFAULT_SHADER_4_COMPONENT_MAPPING 即 可 。 这 样 一 来 ， 
向 量 分 量 的 顺序 将 不 会 改变 ， 它 会 以 纹理 资源 中 默认 的 数据 顺序 直接 返 
回 。 





4. MostDetailedMip: 指定 此 视图 中 图 像 细 节 最 详尽 的 mipmap 层 
级 的 索引 。 此 参数 的 取 值 范 围 在 0 与 MipLevels-1 之 间 。 


5. MipLevels: 自 MostDetailedMip 算 起 ， 待 创建 视图 的 mipmap 
层级 数量 。 通 过 将 这 个 字段 与 MostDetailedMip 配 合 起 来 ， 我 们 就 能 
够 指定 此 视图 mipmap 层 级 的 连续 子 范 围 。 可 以 将 此 字段 设置 为 -1， 用 来 
表示 目 MostDetailedMip 始 至 最 后 一 个 mipmap 层 级 之 间 的 所 有 mipmap 





6. PlaneSlice: 平面 切片 的 索引 〈 详 见 12.3.4 小 节约 理子 资 
源 ) 5 


7. ResourceMinLODClamp: 指定 可 以 访问 的 最 小 mipmap 层 级 。 
设置 为 0.0 表 示 可 以 访问 所 有 的 mipmap 层 级 。 将 此 参数 指定 为 3.0， 则 表 
示 可 以 访问 从 3.0 到 MipCount-1 的 mipmap 层 级 。 


接 下 来 ， 让 我 们 构建 3 个 资源 描述 符 来 填充 在 上 一 小 节 中 所 创建 的 
描述 符 堆 。 




















// 假设 已 创建 下 列 3 个 纹理 资源 
// ID3D12Resourcek bricksTex; 





// ID3D12Resourcek stoneTex; 
// ID3D1i2Resource* tileTex; 


// 获取 指向 描述 符 堆 起 始 处 的 指针 
CD3DX12 CPU DESCRIPTOR HANDLE hDescriptor( 
mSrvDescriptorHeap->GetCPUDescriptorHandleForHeapStart()); 








D3D12 SHADER RESOURCE VIEW DESC srvDesc = {}; 
srvDesc.Shader4ComponentMapping = D3D12 _ DEFAULT_ SHADER 4 COMPONENT_ MAPPING 
2 

srvDesc.Format = bricksTex->GetDesc().Format; 

srvDesc.ViewDimension = D3D12 SRV_DIMENSION TEXTURE2D; 
srvDesc.Texture2D.MostDetailedMip = 6; 

srvDesc.Texture2D.MipLevels = bricksTex->GetDesc().MipLevels; 
srvDesc.Texture2D.ResourceMinLODClamp = 8.6f; 
md3dDevice->CreateShaderResourceView(bricksTex.Get(), &srvDesc, hDescripto 
r); 


// 偏 移 到 堆 中 的 下 一 个 描述 符 处 
hDescriptor.Offset(1, mCbvSrvDescriptorSize); 


srvDesc.Format = stoneTex->GetDesc().Format; 
srvDesc.Texture2D.MipLevels = stoneTex->GetDesc().MipLevels; 
md3dDevice->CreateShaderResourceView(stoneTex.Get(), &srvDesc, hDescriptor 


); 


// 偏 移 到 堆 中 的 下 一 个 描述 符 处 
hDescriptor.Offset(1, mCbvSrvDescriptorSize); 


srvDesc.Format = tileTex->GetDesc().Format; 
srvDesc.Texture2D.MipLevels = tileTex->GetDesc().MipLevels; 
md3dDevice->CreateShaderResourceView(tileTex.Get(), &srvDesc, hDescriptor); 





9.4.4 ”将 纹理 绑 定 到 流水 线 


至 此 ， 我 们 在 每 次 绘制 调用 时 所 指定 的 材质 ， 都 是 由 材质 常量 绥 冲 
区 来 进行 更 新 的 。 这 了 就 意味 痢 在 绘制 调用 的 过 程 中 ， 所 有 的 几何 体 都 将 
使 用 同一 组 材质 数据 。 这 对 程序 而 言 是 一 种 极 大 的 限制 ， 因 为 我 们 将 不 
能 动态 地 指定 每 个 像素 的 材质 ， 继 而 导致 场景 细节 的 缺失 。 纹 理 映 射 技 











术 的 想法 是 用 纹理 图 (texture map) 来 取代 材质 常量 缓冲 区 以 获取 材质 
数据 。 这 将 使 每 个 像素 的 数据 部 是 灵活 可 变化 的 ， 从 而 为 场景 增添 更 丰 
富 的 细节 与 几 分 真实 感 。 








在 本 节 中 ， 我 们 将 添加 漫 反 射 反 照 率 纹理 图 (diffuse albedo texture 
map) ， 以 此 来 给 出 材质 的 瘟 反 射 反 照 率 分 量 。 影 啊 材 质 的 两 个 数 
值 gFresnelR6 与 8Roughness 仍 将 在 每 次 绘制 调用 时 由 材质 常量 缓冲 区 
来 指定 。 而 在 第 19 章 中 ， 我 们 会 介绍 如 何 借 助 纹理 在 像素 层级 指定 粗糙 
度 。 注 意 ， 在 使 用 纹理 贴图 时 ， 我 们 仍 需 在 材质 常量 绥 冲 区 中 保 
留 gDiffuseAlbedo 分 量 。 事 实 上 ， 我 们 在 像素 着 色 器 中 会 以 下 列 方式 
令 纹理 漫 反 射 反照 率 数据 与 DiffuseAlbedo 相 组 合 : 


























// 从 纹理 中 提取 此 像素 的 漫 反 射 反照 率 
float4 texDiffuseAlbedo = gDiffuseMap.Sample( 
gsamAnisotropicWrap, pin.TexC); 





























// 将 纹理 样本 与 常量 缓冲 区 中 的 反照 率 相 乘 
float4 diffuseAlbedo = texDiffuseAlbedo * gDiffuseAlbedo; 





我 们 通常 设 DiffuseAlbedo=(1,1,1,1)， 从 而 
使 texDiffuseAlbedo 不 会 及 生 改 变 。 但 是 ， 有 了 时 对 DiffuseAlbedo 进 
行 适当 的 调整 却 可 以 避免 制作 新 的 纹理 ， 来 看 下 这 种 情况 : 假设 有 一 个 
砖 块 纹理 ， 若 贴图 师 希 望 使 它 的 色调 略 显 偏 蓝 ， 便 可 以 通过 设 
置 DiffuseAlbedo=(6.9,6.9,1,1) 削 减 其 中 的 红色 与 绿色 成 分 来 达到 
这 个 目的 。 








我 们 加 材质 的 定义 中 添加 了 一 个 索引 ， 借 此 引用 了 与 此 材质 相关 联 
的 纹理 描述 堆 中 的 一 个 SRV: 


struct Material 


{ 











// 漫 反 射 纹 理 在 SRV 堆 中 的 索引 














int DiffuseSrvHeapIndex = -1; 





接 下 来 ， 假 设 根 签名 被 定义 为 需要 把 由 着 色 器 资源 视图 构成 的 描述 
符 表 绑 定 到 第 0 个 槽 处 ， 那 么 ， 我 们 便 可 以 通过 下 列 代码 来 使 用 纹理 绘 
制 泻 染 项 : 





void CrateApp: :DrawRenderItems( 
ID3D12GraphicsCommandList* cmdList, 
const std::vector<RenderItem*>& ritems) 
{ 
UINT objCBByteSize = d3dUtil::CalcConstantBufferByteSize(sizeof( 
ObjectConstants ) ) ; 
UINT matCBByteSize = d3dUtil::CalcConstantBufferByteSize(sizeof( 
MaterialConstants ) ) ; 


auto objectCB = mCurrFrameResource->0bjectCB->Resource(); 
auto matCB = mCurrFrameResource->MaterialCB->Resource() ; 


// 对 于 每 个 泻 染 项 而 言 …. 
for(size t i = 6; i «< ritems.size(); ++i) 


{ 


auto ri = ritems[i]; 





cmdList->IASetVertexBuffers(60, 1, &ri->Geo->VertexBufferView!()); 
cmdList->IASetIndexBuffer(&ri->Geo->IndexBufferView()); 
cmdList->IASetPprimitiveTopology(ri->primitiveType); 


CD3DX12_ GPU_DESCRIPTOR HANDLE tex( 
mSrvDescriptorHeap->GetGPUDescriptorHandleForHeapStart()); 
tex.Offset(ri->Mat->DiffuseSrvHeapIndex, mCbvSrvDescriptorSize); 


D3D12_GPU_VIRTUAL ADDRESS objCBAddress 
objectCB->GetGPUVirtualAddress() + 
ri->0bjCBIndex*objCBByteSize; 

D3D12 GPU_VIRTUAL ADDRESS matCBAddress 


matCB->GetGPUVirtualAddress() + 
ri->Mat->MatCBIndex*matCBByteSize; 


cmdList->SetGraphicsRootDescriptorTable(0, tex); 
cmdList->SetGraphicsRootConstantBufferView(1, objCBAddress); 
cmdList->SetGraphicsRootConstantBufferView(3, matCBAddress); 


cmdList->DrawIndexedInstanced(ri->IndexCount,， 
1, ri->StartIndexLocation, 
ri->BaseVertexLocation, 08); 


} 
} 





注 意 Note 


实际 上 ， 纹 理 资源 可 以 运用 于 任何 着 色 器 〈 如 顶点 着 色 器 、 几 何 着 
色 器 与 像素 着 色 嚣 ，〉。 而 我 们 暂时 只 将 它 应 用 于 像素 着 色 器 。 正 如 之 前 
所 述 ， 纹 理 在 本 质 上 是 种 支持 GPU 特 殊 操作 的 特别 数组 ， 因 此 不 难 想 
象 ， 它 们 在 其 他 的 着 色 圳 程序 中 也 能 发 挥 巨大 的 作用 。 








注 意 Note i 


由 于 纹理 图 集 可 以 在 一 次 绘制 调用 中 泻 染 出 多 个 几何 体 ， 因 此 可 以 
将 它 用 于 优化 性 能 。 比 如 说 ， 假 设 我 们 使 用 了 图 8.4 中 含有 板 条 箱 、 草 
地 以 及 砖 块 等 纹理 的 纹理 图 集 。 接 着 ， 通 过 将 每 个 物体 的 纹理 坐标 调整 
至 其 相应 的 子 纹理 ， 我 们 就 能 将 所 有 的 几何 体 都 放置 在 一 个 演 染 项 《〈 假 


设 每 个 物体 都 没有 其 他 需要 修改 的 参数 ) 中 。 通 过 与 Direct3D 的 早期 版 
本 进行 比较 ， 我 们 可 以 发 现 Direct3D 12 己 大 幅度 降低 了 演 染 过 程 中 的 开 
销 。 尽 管 如 此 ， 由 于 绘制 调用 的 过 程 中 依然 会 产生 开销 ， 因 而 仍 需要 这 
类 技术 ， 以 期 将 绘制 调用 的 次 数 降 到 最 少 。 


9.5 ”过 滤器 [5] 


9.5.1 放大 


我 们 可 以 将 纹理 图 中 的 元 素 看 作 是 从 连续 图 像 中 采集 的 离散 颜色 样 
本 ， 但 并 不 应 认为 它们 是 有 着 特定 面积 大 小 的 矩形 。 所 以 ， 当 前 的 疑问 
是 : 如 果 在 纹理 坐标 ,oj 处 没有 与 之 对 应 的 纹 素 点 究竟 会 发 生 什 么 ? 这 
个 问题 有 可 能 在 下 述 情景 中 发 生 : 假设 玩家 慢 慢 靠近 了 场景 中 的 一 堵 墙 
壁 ， 则 墙壁 将 逐渐 放大 并 占据 完整 的 镜头 。 为 了 便于 说 明 问 题 ， 这 里 假 
设 显示 器 的 分 辨 率 为 1024 x 1024， 而 且 墙 壁 纹 理 的 分 辨 率 为 256 x 256。 
由 此 就 产生 了 纹理 放大 (magnification〉 的 概念 我 们 试图 用 少量 纹 
素来 覆盖 大 量 的 像素 。 在 上 述 示例 中 ， 每 个 纹 素 点 之 间 都 列 有 4 个 像 
素 。 当 在 三 角形 中 对 顶点 纹理 坐标 进行 插值 时 ， 每 个 像素 都 将 得 到 其 唯 
一 的 纹理 坐标 。 如 此 一 来 ， 就 有 可 能 发 生 没 有 纹 素 点 与 纹理 坐标 处 的 像 
素 相 对 应 的 情况 《纹理 与 像素 分 辨 率 不 匹配 所 造成 ) 。 对 此 ， 我 们 可 以 
对 纹 素 之 间 的 颜色 数据 进行 插值 估算 ， 从 而 获得 指定 纹 素 处 的 颜色 信 
上 县。 图 形 人 硬件 往往 会 文 持 第 数 插值 〈constant interpolation， 也 有 译作 常 
量 插 值 ) 与 线性 插值 〈linear interpolation ) 两 种 插值 方法 。 在 实践 中 ， 
线性 插值 的 使 用 更 为 普遍。 




















图 9.5 详 细 地 描述 了 这 两 种 方法 在 1D 情 况 下 的 使 用 过 程 : 假设 我 们 
有 一 个 内 含 256 个 样本 的 1D 纹 理 ， 并 且 某 个 插值 纹理 坐标 为 
u = 0.126484375， 所 以 此 归 一 化 纹理 坐标 就 对 应 于 





0.126484375 x 256 = 32.38 处 的 纹 素 。 显 而 易 见 ， 此 值 实际 位 于 两 个 纹 素 
样本 之 间 ， 所 以 我 们 必须 通过 插值 这 一 手段 来 求 取 它 的 近似 值 。 
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图 9.5 图 a 中 ， 知 给 出 了 纹 素 点 ， 我 们 便 可 以 通过 构建 分 段 常量 函数 来 求 出 纹 素 点 之 间 某 处 的 
近似 值 。 由 于 得 到 的 近似 值 为 最 近 纹 素 点 的 取 值 ， 所 以 这 种 方法 有 时 被 称 为 最 近邻 点 采样 
(nearest neighbor point sampling) 。 图 b 中 ， 大 给 出 了 纹 素 点 ， 我 们 便 可 以 通过 构建 分 段 线 性 函 
数 来 求 出 纹 素 点 之 间 某 处 的 近似 值 




















2D 线 性 插值 又 称 为 双 线 性 插值 (bilinear interpolation) ， 其 处 理 流 
程 如 图 9.6 所 示 : 给 出 四 个 纹 系 之 间 的 一 个 纹理 坐标 ， 移 在 水 平方 向 v 上 
进行 两 次 1D 线 性 插值 〈 求 出 cz 与 ce) ， 后 在 垂直 方向 上 再 进行 一 次 1D 
内 插 〈 求 取 c) 。 


CT 一 0.25cf 十 0.75cij+1 


cij Cij+1 
c= 0.62cr 十 0.38cp 
Ci+1y Citl,j+1 





Cp = 0.25ci+ly 十 0.75ci+1j+1 


图 9.6 ”图 中 给 出 了 4 个 纹 素 点 ， 分 别 为 Ci 、ciJ+1L、ci+1J、ci+1lJ+1。 我 们 希望 通过 插值 方 
法 ， 近 似 地 求 出 这 4 个 纹 素 点 之 间 的 纹 素 点 c 的 颜色 。 在 此 例 中 ，c 位 于 57 右 侧 的 0.75 单 位 处 以 
及 Si 下 侧 的 0.38 单 位 处 。 我 们 首先 对 上 侧 两 个 纹 素 点 的 颜色 进行 插值 ， 以 求 出 CT 。 接 着 对 下 














侧 
两 个 纹 素 点 的 颜色 进行 插值 来 求 出 cB。 最 后 ， 我 们 再 对 CT 与 CB 进行 1D 线 性 插值 来 求 取 c 
图 9.7 所 示 为 常数 插值 与 线性 插值 的 差别 。 正 如 我 们 所 看 到 的 ， 用 
Ce 
平滑 ， 但 是 经 过 插值 所 得 到 的 数据 仍 不 如 真实 数据 〈 如 更 高 分 辨 率 的 纹 
理 ) 来 得 完 
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图 9.7 由 于 玩家 走 近 了 具有 板 条 箱 纹 理 的 立方 体 ， 因 而 触发 了 纹理 放大 操作 。 左 图 是 采用 常数 


插值 所 
得 到 的 效果 ， 看 起 来 呈 块 状 且 模糊 。 出 现 这 种 结果 也 是 合情合理 的 ， 因 为 采用 的 并 不 是 具有 连 
续 性 的 插值 


函数 〈 见 图 9.5a) ， 所 以 这 将 使 纹 素 间 颜色 的 变化 比较 突 元 而 不 平滑 。 右 图 是 利用 线性 过 滤 
所 得 到 的 效果 ， 由 于 此 内 插 函 数 具有 连续 性 ， 所 以 图 像 看 起 来 更 为 平滑 








还 有 一 点 需要 注意 的 是 ， 在 以 虚拟 视角 可 以 自由 移动 和 探索 的 交互 
式 3D 程 序 中 ， 纹 理 放 大 是 个 无 法 回避 的 问题 。 在 与 目标 保持 特定 距离 
时 ， 纹 理 可 能 看 上 去 还 不 错 ， 但 是 随 独 观察 点 逐渐 接近 目标 ， 其 效 末 融 
开始 惨不忍睹 了 。 i 二 于 接近 物体 表面 的 行为 进行 了 
限制 ， 以 避免 过 度 的 放大 处 理 。 通 过 使 用 更 高 分 辨 率 的 纹理 也 可 以 使 此 


难题 得 到 一 定 程度 的 改善 。 








在 纹理 这 一 语 境 中 ， 通 过 常数 插值 来 求 得 纹 素 之 间 纹 理 坐 标 处 的 纹 
理 数据 也 称 为 点 过 滤 (point filtering) 。 为 了 求 取 纹 素 之 间 纹 理 坐 标 处 
的 纹理 数据 而 使 用 线性 插值 的 计算 方法 ， 也 称 为 线性 过 滤 〈linear 
flltering) 。 点 过 滤 与 线性 过 滤 是 Direct3D 中 所 第 用 的 术语 。 








9.5.2 ”缩小 


纹理 绷 小 minification) 是 纹理 放大 的 逆 运 算 。 在 缩小 的 过 程 中 ， 
大 量 纹 素 将 被 映射 到 少数 纹理 之 上 。 人 例如， 考虑 下 列 情景 : 假设 有 一 培 
被 256 x 256 纹 理 所 映 射 的 墙壁 ， 玩 家 的 观察 视角 正 紧 有 盯 着 它 ， 并 逐渐 问 
后 退却 。 在 此 过 程 中 ， 这 墙 墙 会 看 上 去 越 来 越 小 ， 直 至 它 在 屏 间 上 只 禾 
盖 大 小 为 64 x 64 像 素 的 区 域 。 此 时 ， 我 们 就 应 当 将 256 x 256 纹 素 映 射 到 
64 x 64 屏 幕 像 素 。 在 这 种 情况 下 ， 像 素 的 纹理 坐标 处 往往 不 会 有 与 之 对 
应 的 纹理 图 纹 素 ， 因 此 还 需要 将 常数 插值 过 滤器 与 线性 插值 过 滤器 运用 
于 纹理 缩小 的 情形 。 然 而 ， 在 执行 纹理 缩小 操作 时 还 有 更 多 的 工作 要 
做 。 从 直观 上 来 讲 ， 通 过 平均 下 采样 (average downsampling) 应 当 可 
以 使 256 x 256 纹 素 减 少 到 64 x 64 纹 素 。 而 mipmap 技 术 则 以 占用 一 些 额外 











的 内 存 为 代价 来 实现 与 之 相似 的 功能 。 在 初始 化 期 间或 资源 创建 时 
期 ) ， 通 过 对 图 像 下 采样 来 创建 mipmap 链 便 可 制作 出 缩小 版 的 纹理 

( 见 图 9.8)〉[ 四 。 因 此 ， 这 里 所 指 的 求 平均 值 所 做 的 工作 实际 上 就 是 针对 
mipmap 的 大 小 执行 预计 算 〈 提 前 制作 出 不 同 规格 的 纹理 ) 。 在 运行 
时 ， 图 形 人 硬件 将 根据 程序 员 的 设 定 ， 从 以 下 两 种 不 同 的 执行 方案 中 择 一 
而 行 : 


2S6x2S6 
-中 一 一 一 一 








图 9.8 ”图 中 所 示 的 是 一 个 mipmap 链 。 每 对 相 邻 的 mipmap 中 ， 
后 者 都 是 前 者 大 小 的 M4。mipmap 的 大 小 最 小 可 至 1 x 1 


1. 在 纹理 贴图 时 ， 选 择 与 待 投影 到 屏幕 上 的 几何 体 分 辨 率 最 为 匹 
配 的 mipmap 层 级 ， 并 根据 具体 需求 选用 常数 插值 或 线性 插值 。 这 便 是 
针对 mipmap 的 点 过 滤 (point filtering) ， 该 名 称 的 由 来 是 因为 此 种 方法 
与 常数 插值 很 相似 一 一 我 们 仅 选取 与 目标 分 辨 率 最 邻近 的 那个 mipmap 
层级 并 用 它 进 行 纹理 贴图 。 


2. 在 纹理 贴图 时 ， 选 取 与 竺 投影 到 屏幕 上 的 几何 体 分 辨 率 最 为 匹 
配 的 两 个 邻近 的 mipmap 层 级 〈 一 个 稍 大 于 屏幕 上 几何 体 的 分 辨 率 ， 一 
个 稍 小 于 屏幕 上 几何 体 的 分 辨 率 ) 。 接 下 来 ， 对 这 两 种 mipmap 层 级 分 
别 应 用 常量 过 滤 或 线性 过 滤 ， 以 生成 它们 各 自 相 应 的 纹理 颜色 。 节 后 ， 











在 这 两 种 插值 纹理 之 间 再 次 进行 颜色 的 插值 计算 。 这 个 过 程 称 

为 mipmap 的 线性 过 波 (inear filtering) ， 原 因 是 这 种 方法 与 线性 插值 
比较 相似 一 一 我 们 需要 对 目标 分 辨 京 最 邻近 的 两 个 mipmap 层 级 进行 插 
值 计算 。 








通过 从 mipmap 链 中 选取 恰当 的 纹理 细节 级 别 ， 可 大 大 减少 纹理 缩 
小 的 运算 次 数 。 


如 9.3.2 节 中 所 述 ， 可 用 Photoshop DDS 格 式 导出 插件 或 使 用 texconv 
程序 来 创建 mipmap 。 这 些 程序 基于 原始 的 图 像 数 据 ， 运 用 下 采样 算法 
来 生成 更 低 的 mipmap 层 级 图 像 。 有 时 候 这 些 算 法 并 不 能 保留 所 希望 的 
图 像 细 市 ， 因 此 还 要 请 贴图 师 杀 手 创建 或 编辑 更 低 mipmap 级 别 的 图 
像 ， 以 保证 不 流失 重要 的 细节 。 


9.5.3 ”各 问 异 性 过 滤 


还 有 一 种 名 为 各 向 异性 过 滤 (anisotropic filtering) 的 过 滤器 类 型 。 
该 过 小 占有 助 于 绥 解 当 多 边 形 法 同 量 与 摄像 机 观察 向 量 之 间 夹 角 过 大 
《比如 当 多 边 形 正 交 于 观察 窗口 时 ) 所 导致 的 失真 现象 。 这 种 过 滤器 的 
开销 最 大 ， 但 是 其 校正 失真 的 效果 的 确 对 得 起 它 所 消耗 的 资源 。 图 9.9 











展示 了 各 疝 寞 性 过 小 与 线性 过 滤 两 者 的 比较 效果 。 





图 9.9 板 条 箱 的 顶 面 基本 上 已 正 交 于 观察 窗口 。 左 图 中 的 板 条 箱 项 面 采 用 了 
线性 过 滤 ， 其 效果 模糊 得 一 塌 糊 涂 。 右 图 以 同样 的 角度 观察 通过 
各 向 异性 过 滤 绘制 的 板 条 箱 顶 面 ， 却 呈现 出 细节 更 佳 的 泻 染 效果 





9.6 ”和 寻 址 模式 


可 将 经 过 常数 插值 或 线性 插值 的 纹理 定义 为 一 个 返回 同 量 值 的 函数 
T(w,v) = (7,g,b,4a)， 即 给 定 纹理 坐标 (w*) s [0, 1]'， 则 上 述 纹理 函数 将 
返回 颜色 (7,9,5,4)。Direct3D 人 允许 我 们 采用 下 列 4 种 不 同方 式 ( 即 寻 址 模 
式 ，address mode) 来 扩充 此 函数 的 定义 域 〈 解 决 输入 值 超出 定义 域 这 
一 问题 ) ， 它 们 是 重复 寻 址 模式 (wrap) 、 边 框 颜色 寻 址 模式 (border 
color， 也 有 译作 边界 颜色 寻 址 模式 ) 、 钳 位 寻 址 模式 (clamp) 与 镜像 
寻 址 模式 (mirror) 。 








1. 重复 寻 址 模式 通过 在 坐标 的 每 个 整数 点 〈integer junction) 处 重 
复 绘制 图 像 来 拓 充 纹理 函数 〈 见 图 9.10) 。 
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(X2,y2,22) 
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(0.0,2.5) 


(Xo, Yo, 20) 


图 9.10 ”重复 寻 址 模式 





2. 边框 颜色 寻 址 模式 通过 将 每 个 不 在 范围 0, 1] 内 的 坐标 (w?) 都 映 
冉 为 程序 员 指 定 的 颜色 而 拓 充 纹理 函数 〈 见 图 9.11)。 





3. 错位 寻 址 模式 通过 将 范围 0, 起 外 的 每 个 坐标 (wo) 都 映射 为 颜色 
T(uwo,wo) 来 扩充 纹理 函数 ， 其 中 ，(w;w0) 为 范围 0, 二 内 距离 (wo) 最 近 的 
点 〈 见 图 9.12) 。 
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图 9.11 边框 颜色 寻 址 模式 
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图 9.12 ” 钳 位 寻 址 模式 


4. 镜像 寻 址 模式 通过 在 坐标 的 每 个 整数 点 处 绘制 图 像 的 镜像 来 扩 
充 纹理 函数 〈 见 图 9.13) 。 
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图 9.13 ”镜像 寻 址 模式 











在 程序 中 总 是 要 指定 一 种 寻 址 模式 的 《默认 为 重复 寻 址 模式 ) ， 
此 在 范围 [0, 1] 之 外 的 纹理 坐标 也 必然 有 定义 。 


重复 寻 址 也 许 是 最 常 使 用 的 一 种 模式 ， 它 允许 我 们 将 一 种 纹理 反复 
平 铺 到 某 一 表面 上 。 也 就 是 说 ， 这 种 寻 址 模式 使 我 们 在 不 提供 额外 数据 
的 情况 下 ， 亦 可 提升 纹理 的 分 辨 率 〈 尽 管 范围 0, ]] 之 外 的 内 容 是 重复 
的 ) 。 在 执行 平 铺 的 时 候 ， 纹 理 是 否 能 无 终 衔 接 往往 也 是 一 个 重点 。 例 
如 ， 车 板 条 箱 纹理 原本 并 不 是 无 颖 连接 的 ， 那 么 我 们 就 能 够 明显 地 看 出 
它 是 在 反复 贴 同一 张 图 。 然 而 ， 图 9.14 中 所 展示 的 可 无 颖 衔接 砖 块 纹理 
却 重复 绘制 了 2 x 3 次 ， 读 者 是 否 对 此 有 所 察觉 呢 ? 














平 销 2X3 次 




















图 9.14 ”将 一 种 砖 块 纹理 平 铺 2 x 3 次 的 效果 。 由 于 此 纹理 是 一 种 无 颖 贴图 ， 
因此 很 难 察觉 到 我 们 采用 了 重复 寻 址 模式 








在 Direct3D 中 ， 寻 址 模式 由 枚 举 类 型 
D3D12 TEXTURE_ADDRESS_MODE 来 表示 : 


typedef enum D3D12 TEXTURE ADDRESS MODE 


D3D12_TEXTURE_ADDRESS_MODE_WRAP 
D3D12_TEXTURE_ADDRESS_MODE_MIRROR 


D3D12_TEXTURE_ADDRESS_MODE_CLAMP 
D3D12_TEXTURE_ADDRESS MODE_BORDER 
D3D12_TEXTURE_ADDRESS MODE MIRROR_ONCE 

} D3D12 TEXTURE ADDRESS MODE; 





9.7 ”采样 器 对 象 


从 前 面 两 个 小 节 中 可 以 看 出 ， 在 运用 纹理 的 过 程 中 ， 除 了 纹理 数据 
本 冉 之 外 ， 还 有 为 外 两 个 相关 的 重要 概念 ， 即 纹理 过 小 以 及 寻 址 模式 。 
采集 纹理 资源 时 所 用 的 过 滤器 和 寻 址 模式 都 是 由 采样 器 对 象 (sampler 
object) 来 定义 的 。 一 个 应 用 程序 通常 需要 采用 耕 干 个 采样 占 对 象 以 不 
同 的 方式 来 采集 纹理 。 





9.7.1 创建 采样 器 





正如 我 们 将 在 下 一 小 节 中 所 看 到 的 ， 采 样 器 会 被 着 色 器 所 用 。 为 了 
将 采样 器 绑 定 到 着 色 器 上 供 其 使 用 ， 我 们 就 需要 为 采样 器 对 象 绑 定 描述 
符 。 下 面 的 代码 展示 了 这 样 的 一 个 根 签名 示例 ， 它 的 第 二 个 权 位 获取 了 
一 个 描述 符 表 ， 此 表 中 存 有 1 个 与 采样 器 寄存 器 槽 0 相 绑 定 的 采样 锅 描 述 
符 。 











CD3DX12_DESCRIPTOR RANGE descRange[3]; 

descRange[8] .Init(D3D12_ DESCRIPTOR RANGE_TYPE_SRV, 1, 8); 
descRange[1] .Init(D3D12 DESCRIPTOR RANGE TYPE SAMPLER, 1, ©); 
descRange[2] .Init(D3D12 DESCRIPTOR RANGE _ TYPE CBV, 1, 8); 


CD3DX12_ ROOT_PARAMETER rootParameters[3]; 

FootParameters[6].InitAsDescriptorTable(1，&descRange[6]， 
D3D12_SHADER_VISIBILITY_PIXEL ) ; 

FootParameters[1].InitAsDescriptorTable(1，&descRange[1]， 
D3D12_SHADER_VISIBILITY_PIXEL ) ; 

FootParameters[2].InitAsDescriptorTable(1，&descRange[2]， 
D3D12_SHADER VISIBILITY ALL); 


CD3DX12_ ROOT_SIGNATURE_ DESC descRootSignature; 
descRootSignature.Init(3, rootParameters, 6, nullptr, 


D3D12_ROOT_SIGNATURE_FLAG_ALLOW_INPUT_ASSEMBLER_INPUT_LAYOUT); 


从 ， 还 需 一 个 采样 器 堆 。 而 要 创建 采样 器 
堆 ， 就 应 通过 填写 D3D12_DESCRIPTOR_HEAP_DESC 结 构 体 实例 并 将 其 
ee ne 


D3D12_ DESCRIPTOR_ HEAP_DESC descHeapSampler = {}; 
descHeapSampler.NumDescriptors = 1; 

descHeapSampler.Type = D3D12 DESCRIPTOR_ HEAP_TYPE_SAMPLER; 
descHeapSampler.Flags = D3D12 DESCRIPTOR HEAP_FLAG SHADER VISIBLE; 


CompPtr<ID3D12DescriptorHeap> mSamplerDescriptorHeap; 

ThrowIfFailed(mDevice->CreateDescriptorHeap(&descHeapSampler， 
_uuidof(ID3D12DescriptorHeap )， 
(void**)&mSamplerDescriptorHeap)); 





只 要 有 了 采样 器 堆 ， 就 能 创建 采样 器 描述 符 了 。 此 时 ， 我 们 再 通过 
填写 D3D12_SAMPLER_DESC 对 象 来 指定 寻 址 模式 、 过 滤器 类 型 以 及 其 他 
一 些 参数 。 





typedef struct D3D12_SAMPLER_DESC 
{ 
D3D12_ FILTER Filter; 
D3D12 TEXTURE ADDRESS MODE AddressU; 
D3D12 TEXTURE ADDRESS MODE AddressyV; 
D3D12 TEXTURE ADDRESS MODE AddressW; 


FLOAT MipLODBias; 
UINT MaxAnisotropy; 
D3D12 COMPARISON FUNC ComparisonFunc; 
FLOAT BorderColor[ 4 ]; 
FLOAT MinLOD; 
FLOAT MaxLOD; 
} D3D12 SAMPLER DESC; 





1. Filter: D3D12_FILTER 枚 举 类 型 的 成 员 之 一 ， 用 以 指定 采样 
纹理 时 所 用 的 过 滤 方 式 。 


2. AddressU: 纹理 在 水 平 u 轴 方向 上 所 用 的 寻 址 模式 。 





3. AddressV: 纹理 在 垂直 v 轴 方向 上 所 用 的 寻 址 模式 。 








4. AddressW: 纹理 在 深度 w 轴 方向 上 所 用 的 寻 址 模式 〈 仅 限于 3D 
纹理 ) 。 


5. MipLODBias: 设置 mipmap 层 级 的 偏 置 值 。 如 果 将 此 值 指定 为 
0.0， 则 表示 mipmap 层 级 保持 不 变 ; 知 将 此 参数 设置 为 2，mipmap 层 级 
设置 为 ?9， 则 将 按 层级 5 〈3+2) 进行 采样 。 


6. MaxAnisotropy: 最 大 各 癌 异 性 值 ， 此 参数 的 取 值 区 间 为 
[1,16]。 只 有 将 Filter 设 置 为 D3D12_FILTER_ANISOTROPIC 
或 D3D12_FILTER_COMPARISON_ANISOTROPIC 之 后 该 项 才能 生效 。 此 
数值 越 大 也 就 意味 着 开销 越 大 ， 但 是 用 户 同时 会 获得 更 棒 的 泻 染 效果 。 





7. ComparisonFunc: 用 于 实现 像 阴影 贴图 (shadow mapping) 这 
样 一 类 特殊 应 用 的 高 级 选项 。 在 未 触及 阴影 贴图 等 章节 之 前 ， 暂 时 只 将 
它 设置 为 D3D12_COMPARISON_FUNC_ALWAYS。 


8. BorderColor: 用 于 指定 
在 D3D12_TEXTURE_ADDRESS_MODE_BORDER 寻 址 模式 下 的 边框 颜色 。 


9. MinLOD: 可 供 选 择 的 最 小 mipmap 层 级 。 


10. MaxLOD: 可 供 选 择 的 最 大 mipmap 层 级 。 


以 下 是 一 些 D3D12_FILTER 类 型 的 常用 选项 。 


1. D3D12_FILTER_MIN _MAG MIP_POINT: 对 纹理 图 与 mipmap 层 
级 〈 即 最 接近 于 目标 物体 分 辨 率 的 mipmap 层 级 ) 进行 点 过 滤 。 


2. D3D12_FILTER_MIN_MAG_LINEAR_MIP_POINT: 对 纹理 图 进行 
双 线 性 过 滤 ， 但 对 mipmap 层 级 〈 即 最 接近 于 目标 物体 分 辨 率 的 mipmap 
层级 ) 使 用 点 过 滤 。 


3. D3D12_FILTER_MIN_MAG _MIP_LINEAR: 对 纹理 图 进行 双 线 性 
过 小 ， 还 要 在 两 个 邻近 的 较 高 、 较 低 mipmap 层 级 之 间 进 行 线 性 过 小 。 
因此 ， 这 也 被 称 为 三 线性 过 小 (trilinear filtering) 。 


4. D3D12_FILTER_ANISOTROPIC: 对 于 纹理 的 放大 、 缩 小 以 及 
mipmap 均 采用 癌 异 性 过 滤 。 


我 们 可 以 根据 这 组 示例 推测 出 其 他 可 能 的 组 合 选项 ， 也 可 以 通过 碍 
阅 SDK 文 档 来 了 解 D3D12_FILTER 中 的 其 他 枚 举 类 型 。 


以 下 实例 展示 了 如 何在 描述 符 堆 中 为 采样 需 创 建 出 对 应 的 描述 符 ， 
该 采样 器 使 用 的 是 线性 过 滤 与 重复 寻 址 模式 ， 其 他 参数 则 保留 其 默认 
值 : 








D3D12_SAMPLER_DESC samplerDesc = {}; 
samplerDesc.Filter = D3D12 FILTER MIN MAG MIP_LINEAR; 
samplerDesc.AddressU = D3D12 TEXTURE ADDRESS MODE_WRAP; 


samplerDesc.AddressV = 
samplerDesc.AddressW = 
samplerDesc.MinLOD = 0) 
samplerDesc.MaxLOD = D3D12 FLOAT32 MAX; 


D3D12_TEXTURE_ADDRESS_ MODE_WRAP; 
D3D12_TEXTURE_ADDRESS_ MODE_WRAP; 


samplerDesc.MipLODBias = 60.6f; 
samplerDesc.MaxAnisotropy = 1; 
samplerDesc.ComparisonFunc = D3D12 COMPARISON FUNC ALWAYS; 


md3dDevice->CreateSampler(&samplerDesc, 
mSamplerDescriptorHeap->GetCPUDescriptorHandleForHeapStart()); 





下 面 的 代码 则 次 明了 怎样 将 采样 器 描述 符 绑 定 到 预定 的 根 签名 参数 
槽 ， 以 供 着 色 器 程序 使 用 : 


commandList->SetGraphicsRootDescriptorTable(1, 
mSamplerDescriptorHeap->GetGPUDescriptorHandleForHeapStart()); 
寺 名 -太太 蕊 
9.7.2 静态 采样 器 


事实 证 明 ， 图 形 应 用 程序 通 癌 不 会 使 用 过 多 的 采样 器 。 为 此 ， 
Direct3D 专 门 提供 了 一 种 特殊 的 方式 来 定义 采样 器 数组 ， 使 用 户 可 以 在 
不 创建 采样 器 堆 的 情况 下 也 能 对 它们 进行 配 
置 。CD3DX12_ROOT_SIGNATURE_DESC 类 有 两 种 参数 不 同 的 Init 函 数 ， 
用 户 可 以 借 此 为 应 用 程序 定义 所 用 的 静态 采样 器 数组 。 我 们 通过 结构 
体 D3D12_STATIC_SAMPLER_DESC 来 描述 静态 采样 器 ， 它 
与 D3D12_SAMPLER_DESC 结 构 体 比较 相似 ， 但 在 以 下 方面 存在 区 别 。 











1. 边框 颜色 存在 一 些 限 制 ， 即 静态 采样 喜 的 边框 颜色 必须 为 下 列 





enum D3D12_STATIC BORDER COLOR 
{ 
D3D12_STATIC BORDER COLOR TRANSPARENT_ BLACK = 0, 
D3D12_STATIC BORDER COLOR OPAQUE BLACK = ( 
D3D12_STATIC BORDER COLOR TRANSPARENT BLACK + 1 ) ， 
D3D12_STATIC BORDER COLOR OPAQUE WHITE = ( 


D3D12_STATIC_BORDER_COLOR_OPAQUE_BLACK + 1 ) 
} D3D12_STATIC_BORDER_COLOR 

2. 含有 额外 的 字段 用 来 指定 着 色 器 寄存 器 、 寄 存 器 空间 以 及 着 色 
恬 的 可 见 性 ， 这 些 其 实 都 是 配置 采样 费 堆 的 相关 参数 。 男 外 ， 用 户 只 能 
定义 2032 个 脐 态 采样 占 ， 对 于 大 多 数 应 用 程序 而 言 是 够 用 了 。 然 而 ， 如 
果 这 个 数量 真 的 无 法 使 我 们 满足 ， 那 束 只 有 男 建 采样 费 堆 来 使 用 非 静 态 
采样 医 了 。 








我 们 在 演示 程序 中 所 用 的 是 静态 采样 器 ， 下 述 代 码 展 示 了 怎样 来 定 
义 它们 。 注 意 ， 我 们 的 演示 程序 可 能 并 不 会 用 到 所 有 的 这 些 静 态 采 样 
项 ， 但 却 会 一 直 保 留 这 些 定 义 ， 这 样 一 来 ， 在 需要 的 时 候 便 触 手 可 及 。 

这 些 预 留 的 静态 采样 费 并 不 多 ， 而 且 它 们 也 不 会 影响 后 续 再 定义 的 或 用 
或 不 用 的 其 他 采样 希 。 











std: :array<const CD3DX12 STATIC SAMPLER DESC, 6> 
TexColumnsApp: :GetStaticSamplers() 











// 应 用 程序 一 般 只 会 用 到 这 些 采 样 器 中 的 一 部 分 
// 所 以 就 将 它们 全 部 提前 定义 好 ， 并 作为 根 签名 的 一 部 分 保留 下 来 

















const CD3DX12 STATIC SAMPLER DESC pointWrap( 
6，// 着 色 器 寄存 器 
D3D12_FILTER_MIN_MAG MIP_POINT，// 过 滤器 类 型 
D3D12_TEXTURE_ADDRESS_MODE_WRAP，// U 轴 方向 上 所 用 的 寻 址 模式 
D3D12_TEXTURE_ADDRESS_MODE_WRAP，// V 轴 方向 上 所 用 的 寻 址 模式 
D3D12_TEXTURE_ADDRESS_MODE_WRAP); // W 轴 方向 上 所 用 的 寻 址 模式 
































const CD3DX12 STATIC SAMPLER DESC pointClamp( 
1，// 着 色 器 寄存 器 
D3D12_FILTER_MIN _MAG MIP_POINT，// 过 滤器 类 型 
D3D12_TEXTURE_ADDRESS_MODE_CLAMP，// U 轴 方向 上 所 用 的 寻 址 模式 
D3D12 _TEXTURE_ADDRESS_MODE_CLAMP，// V 轴 方向 上 所 用 的 寻 址 模式 
D3D12_TEXTURE_ADDRESS_MODE_CLAMP); // W 轴 方向 上 所 用 的 寻 址 模式 






































const CD3DX12 STATIC SAMPLER DESC linearWrap( 
2，// 着 色 器 寄存 器 





} 


D3D12_FILTER _MIN _MAG MIP_LINEAR，// 过 滤器 类 型 

D3D12_TEXTURE_ADDRESS_MODE_WRAP，// U 轴 方向 上 所 用 的 寻 址 模式 
D3D12_TEXTURE_ADDRESS_MODE_WRAP，// V 轴 方向 上 所 用 的 寻 址 模式 
D3D12_TEXTURE_ADDRESS_MODE_WRAP); // W 轴 方向 上 所 用 的 寻 址 模式 





























const CD3DX12 STATIC SAMPLER DESC linearClamp( 
3，// 着 色 器 寄存 器 
D3D12_FILTER _MIN _MAG MIP_LINEAR，// 过 滤器 类 型 
D3D12_TEXTURE_ADDRESS_MODE_CLAMP，// U 轴 方向 上 所 用 的 寻 址 模式 
D3D12_TEXTURE_ADDRESS_MODE_CLAMP，// V 轴 方向 上 所 用 的 寻 址 模式 
D3D12_TEXTURE_ADDRESS_MODE_CLAMP); // W 轴 方向 上 所 用 的 寻 址 模式 






































const CD3DX12 STATIC SAMPLER DESC anisotropicwrap( 
4，// 着 色 器 寄存 器 
D3D12 FILTER_ANISOTROPIC，// 过 滤器 类 型 
D3D12_TEXTURE_ADDRESS_MODE_WRAP，// U 轴 方向 上 所 用 的 寻 址 模式 
D3D12_TEXTURE_ADDRESS_MODE_WRAP，// V 轴 方向 上 所 用 的 寻 址 模式 
D3D12_TEXTURE_ADDRESS_MODE_WRAP，// W 轴 方向 上 所 用 的 寻 址 模式 
0.6f, // mipmap 层 级 的 偏 置 值 
8); // 最 大 各 向 异性 值 















































const CD3DX12 STATIC SAMPLER DESC anisotropicClamp( 
5，// 着 色 器 寄存 器 
D3D12_FILTER_ANISOTROPIC，// 过 滤器 类 型 
D3D12 _TEXTURE_ADDRESS_MODE_CLAMP，// U 轴 方向 上 所 用 的 寻 址 模式 
D3D12 _TEXTURE_ADDRESS_MODE_CLAMP，// V 轴 方向 上 所 用 的 寻 址 模式 
D3D12 _TEXTURE_ADDRESS_MODE_CLAMP，// W 轴 方向 上 所 用 的 寻 址 模式 

















6.6f， // mipmap 层 级 的 偏 置 值 
8 ) ; // 最 大 各 向 异性 值 
return { 


pointWrap, pointClamp, 
linearWrap, linearClamp, 
anisotropicWrap, anisotropicClamp }; 


void TexColumnsApp: :BuildRootSignature() 


{ 


CD3DX12_DESCRIPTOR_ RANGE texTable; 
texTable.Init(D3D12 DESCRIPTOR RANGE TYPE_SRV, 1, 0); 











// 根 参数 可 以 是 描述 符 表 、 根 描述 符 或 根 常 量 
CD3DX12 ROOT_ PARAMETER slotRootParameter[4]; 


slotRootPparameter[8].InitAsDescriptorTable(1, 
&texTable, D3D12 SHADER VISIBILITY PIXEL); 
slotRootPparameter[1].InitAsConstantBufferView(0); 


slotRootPparameter[2].InitAsConstantBufferView(1); 
slotRootPparameter[3].InitAsConstantBufferView(2); 


auto staticSamplers = GetStaticSamplers(); 





// 根 签名 即 是 一 系列 根 参数 

CD3DX12_ROOT_SIGNATURE_DESC rootSigDesc(4, slotRootPparameter, 
(UINT)staticSamplers.size(), staticSamplers.data(), 
D3D12 ROOT_SIGNATURE FLAG ALLOW INPUT ASSEMBLER INPUT LAYOUT); 








// 创建 具有 4 个 槽 位 的 根 签名 ， 第 一 个 指向 含有 单个 着 色 器 资源 视图 的 描述 符 表 ， 其 他 3 个 
各 指向 一 个 

// 量 绥 冲 区 视图 

Comptr<ID3DBlob> serializedRootSig = nullptr; 

ComPptr<ID3DBlob> errorBlob = nullptr; 

HRESULT hr = D3D12SerializeRootSignature(&rootSigDesc, 
D3D_ROOT_SIGNATURE VERSION 1, 
serializedRootSig.GetAddressOf(), errorBlob.GetAddressOf()); 











Ba 




















if(errorBlob != nullptr) 


{ 

: :OutputDebugStringA((char*)errorBlob->GetBufferpointer()); 
} 
ThrowIfFailed(hr); 


ThrowIfFailed(md3dDevice->CreateRootSignature( 
6， 
serializedRootSig->GetBufferPointer()， 
serializedRootSig->GetBufferSize()， 
IID_PPV_ARGS(mRootSsignature.GetAddressof() ) ) ); 





9.8 在 着 色 器 中 对 纹理 进行 采样 





过 下 列 HLSL 语 法 来 定义 纹理 对 象 ， 并 将 其 分 配给 特定 的 纹理 寄 
有 


Texture2D gDiffuseMap : register(t0); 


注意 ， 纹 理 寄 存 器 由 tn 来 标定 ， 其 中 ， 整 数 n 表 示 的 是 纹理 寄存 天 
的 槽 号 。 此 根 签名 的 定义 指出 了 由 覃 位 参数 到 着 色 器 寄存 器 的 映射 天 
系 ， 这 便 是 应 用 程序 代码 能 将 SRV 绑 定 到 着 色 需 中 特定 Texture2D 对 象 
的 原因 。 





类 似 地 ， 下 列 HLSL 语 法 定义 了 多 个 采样 器 对 象 ， 并 将 它们 分 别 分 
配 到 了 特定 的 采样 器 寄存 器 


SamplerState gsamPpointWrap : register(sQ); 
SamplerState gsamPointClamp : register(s1); 
SamplerState gsamLinearWrap : register(s2); 


SamplerState gsamLinearClamp : register(s3); 
SamplerState gsamAnisotropicWrap : register(s4); 
SamplerState gsamAnisotropicClamp : register(s5); 





这 些 采 样 器 对 应 于 我 们 在 上 一 节 中 所 配置 的 静态 采样 器 数组 。 注 
采样 器 寄存 器 由 sn 来 指定 ， 其 中 整数 n 表 示 的 是 采样 吉 寄 存 嚣 的 覃 


涡 


由 


现在 ， 我 们 在 像素 着 色 器 中 为 每 个 像素 都 指定 其 相应 的 纹理 坐标 
(u,v)， 并 通过 Texture2D: :Sample 方 法 正式 地 进行 纹理 采样 。 


Texture2D gDiffuseMap : register(t6); 


SamplerState gsamPpointWrap : _ register(s6) ; 
SamplerState gsamPointClamp : register(s1) ; 
SamplerState gsamLinearWrap : register(s2); 
SamplerState gsamLinearClamp : register(s3); 
SamplerState gsamAnisotropicWrap : register(s4); 
SamplerState gsamAnisotropicClamp : register(s5); 


struct VertexOut 

{ 
float4 PosH : SV_POSITION; 
float3 PosW : POSITION; 
float3 NormalW : NORMAL; 
float2 TexC : TEXCOORD; 

}; 


float4 PS(VertexOut pin) : SV_Target 


float4 diffuseAlbedo = gDiffuseMap.Sample(gsamAnisotropicWrap, pin.TexC) 


* gDiffuseAlbedo; 





我 们 通过 向 Sample 方 法 的 第 一 个 参数 传递 SamplerState 对 象 来 描 
述 如 何 对 纹理 数据 进行 采样 ， 再 向 第 二 个 参数 传递 像素 的 纹理 坐标 (w, 
。 这 个 方法 将 利用 SamplerSstate 对 象 所 指定 的 过 滤 方 法 ， 返 回 纹理 图 
在 点 (ww 处 的 插值 颜色 。 


9.9 ” 板 条 箱 演示 程序 


我 们 现在 开始 学 习 辐 立 方 体 添加 板 条 箱 纹理 的 关键 步骤 〈 见 图 
912) 


9.9.1 指定 纹理 坐标 


GeometryGenerator: :CreateBox 函 数 用 于 生成 立方 体 的 纹理 坐 
标 ， 因 此 得 以 使 纹理 图 像 映 射 到 立方 体 的 每 个 表面 。 考 虑 到 篇 幅 原 因 ， 
这 里 只 给 出 立方 体 前 表面 、 后 表面 以 及 上 表面 的 项 点 定义 。 男 外 ， 我 们 
还 省 略 了 Vertex 构 造 函 数 中 法 线 以 及 切 同 量 的 坐标 (纹理 坐标 的 有 关 
部 分 字体 已 被 加 粗 〉。 








GeometryGenerator: :MeshData GeometryGenerator::CreateBox( 
float width, float height, float depth, 
uint32 numSubdivisions) 


MeshData meshData; 


Vertex v[24]; 


float w2 = 8.5f*width; 
float h2 = 86.5f*height; 
float d2 = 6.5f*depth; 




















// 填写 立方 体 前 表面 的 顶点 数据 














v[86] = Vertex(-w2, -h2, -d2, ..., 868.6f, 1.6f); 
v[1] = Vertex(-w2, +h2, -d2, ..., 6.6f, 0.6f); 
v[2] = Vertex(+w2, +h2, -d2, ..., 1.6f, 0.6f); 
v[3] = Vertex(+w2, -h2, -d2, ..., 1.6f, 1.6f); 














// 填写 立方 体 后 表面 的 顶点 数据 
v[4] = Vertex(-w2, -h2, +d2, ..., 1.6f, 1.6f); 
v[5] = Vertex(+w2, -h2, +d2, ..., 868.6f, 1.6f); 

















v[6] = Vertex(+N2，+h2，+d2，...，6.0f，6.6f); 
v[7] = Vertex(-w2, +h2, +d2, ..., 1.6f, 0.6f); 

















// 填写 立方 体 上 表面 的 顶点 数据 














v[8] = Vertex(-w2, +h2, -d2, ..., 6.6f, 1.6f); 
v[9] = Vertex(-w2, +h2, +d2, ..., 68.6f, 0.6f); 
v[16] = Vertex(+w2, +h2, +d2, ..., 1.6f, 0.6f); 
v[11] = Vertex(+w2, +h2, -d2, ..., 1.6f, 1.6f); 





如 果 息 记 了 纹理 坐标 为 何如 此 定义 ， 可 回顾 图 9.3。 


9.9.2 ”创建 纹理 


我 们 通过 下 列 代码 在 初始 化 阶段 利用 dds 文 件 来 创建 纹理 。 





























// 将 纹理 相关 数据 组 织 在 一 起 的 辅助 结构 体 
struct Texture 


{ 


























// 便于 查找 材质 所 用 的 唯一 名 称 


std::string Name; 











std: :wstring Filename; 


Microsoft: :WRL: :Comptr<ID3D12Resource> Resource = nullptr; 
Microsoft: :WRL: :Comptr<ID3D12Resource> UploadHeap = nullptr; 


}; 
std: :unordered map<std::string, std::unique ptr<Texture>> mTextures; 


void CrateApp: :LoadTextures() 
{ 
auto woodCrateTex = std::make unique<Texture>(); 
woodCrateTex->Name = "woodCrateTex"; 
woodCrateTex->Filename = L"Textures/WoodCrateQ@1 .dds"; 
ThrowIfFailed(DirectX: :CreateDDSTextureFromFile12(md3dDevice.Get(), 
mCommandList.Get(), woodCrateTex->Filename.c_ str(), 
woodCrateTex->Resource, woodCrateTex->UploadHeap)); 


mTextures[woodCrateTex->Name] = std::move(woodCrateTex); 





我 们 将 每 个 彼此 独立 的 纹理 都 存 于 一 个 无 序 映 财 表 (unordered 
map) 之 中 ， 再 根据 它们 各 自 的 名 称 来 查找 相应 的 纹理 。 在 实际 的 产品 
代码 中 ， 我 们 应 当 在 纹理 加 载 之 前 检测 它 的 数据 是 否 已 经 存在 〈 即 它 是 
人 否 已 经 被 加 载 于 无 序 映 射 表 之 中 ) ， 以 防 发 生 同 一 纹理 被 加 载 多 次 的 情 
况 。 








9.9.3 ”设置 纹理 


如 果 纹 理 已 被 创建 ， 并且 它 的 SRV 也 存在 于 描述 符 堆 中 ， 那 么 ,我 
们 只 要 把 所 需 纹 理 设置 到 根 签 名 参数 以 将 其 绑 定 至 泻 染 流水 线 ， 便 能 使 
它 在 着 色 器 程序 中 得 以 使 用 。 

















// 获取 欲 绑 定 纹理 的 SRV 

CD3DX12_GPU_DESCRIPTOR_HANDLE tex( 
mSrvDescriptorHeap->GetGPUDescriptorHandleForHeapStart()); 
tex.Offset(ri->Mat->DiffuseSrvHeapIndex, mCbvSrvDescriptorSize); 
































// 将 纹理 SRV 绑 定 到 根 参数 9。 根 参 数 指示 了 该 纹理 将 要 具体 绑 定 到 哪 一 个 着 色 器 寄存 器 模 
cmdList->SetGraphicsRootDescriptorTable(6，tex) ; 




















9.9.4 更 新 HLSL 部 分 代码 


以 下 是 经 过 修改 的 Default.hlsl 文 件 ， 现 已 支持 纹理 贴图 (与 纹理 贴 
图 有 关 的 代码 部 分 为 粗 体 字 ) 。 





// 默认 的 光源 数量 
#ifndef NUM_DIR_LIGHTS 
#define NUM_DIR_LIGHTS 3 


#endif 


#ifndef NUM POINT_ LIGHTS 
#define NUM POINT LIGHTS 6 
#endif 


#ifndef NUM SPOT_LIGHTS 
#define NUM SPOT_LIGHTS 6 
#endif 


// 包含 了 光照 所 用 的 结构 体 和 函数 
#include "LightingUtil.h1sl1” 


Texture2D gDiffuseMap : register(t0); 


SamplerState gsamPpointWrap 

SamplerState gsampointClamp 
SamplerState gsamLinearWrap 
SamplerState gsamLinearClamp 


SamplerState gsamAnisotropicWrap 
SamplerState gsamAnisotropicClamp : 








// 每 一 帧 都 有 变化 的 常量 数据 





cbuffer cbPerObject : register(b6) 


{ 
float4x4 gWorld; 


float4x4 gTexTransform; 


}; 


// 绘制 过 程 中 所 用 的 杂项 常量 数据 
cbuffer cbPass : register(b1) 
{ 
float4x4 gView; 
float4x4 gInvView; 
float4x4 gProj; 
float4x4 gInvProj; 
float4x4 gViewProj; 
float4x4 gInvViewProj; 
float3 8gEyePosW; 
float cbPerObjectPad1; 
float2 gRenderTargetSize; 








float2 gInvRenderTargetSize; 


float gNearz; 

float gFarz; 

float gTotalTime; 
float gDeltaTime; 
float4 gAmbientLight; 


register(s0); 
register(s1); 
register(s2); 
register(s3); 
register(s4); 
register(s5); 


// 对 于 每 个 以 MaxLights 为 光源 数量 最 大 值 的 对 象 而 言 ， 索 引 [@, NUM_DIR_LIGHTS) 表 示 
的 是 方向 光 

// 源 ， 索 引 [NUM_DIR_LIGHTS，NUM_DIR_LIGHTS+NUM_POINT_LIGHTS) 表 示 的 是 点 光源 

// 索引 [NUM_DIR_LIGHTS+NUM_POINT_LIGHTS，NUM_DIR_LIGHTS+NUM_POINT_LIGHT+ 
NUM_SPOT LIGHTS) 表 示 的 是 聚光灯 光源 

Light gLights[MaxLights]; 
}; 


// 每 种 材质 都 有 所 区 别 的 常量 数据 
cbuffer cbMaterial : register(b2) 
{ 

float4 gDiffuseAlbedo; 

float3 gFresnelRe; 

float gRoughness; 

float4x4 gMatTransform; 


}; 

















struct VertexIn 

{ 
float3 PosL : POSITION; 
float3 NormalL : NORMAL; 
float2 TexC : TEXCOORD; 


}; 


struct VertexOut 

{ 
float4 PosH : SV_POSITION; 
float3 PosW : POSITION; 
float3 NormalW : NORMAL; 
float2 TexC : TEXCOORD; 


}; 


VertexOut VS(VertexIn vin) 


{ 
VertexOut vout = (VertexOut)0.0ef; 

















// 把 坐标 变换 到 世界 空间 
float4 posW = mul(float4(vin.PosL, 1.6f), gWorld); 
vout .PosW = posW.xyz; 




















// 假设 这 里 正在 进行 的 是 等 比 缩放 ， 否 则 便 需 要 使 用 世界 矩阵 的 逆转 置 和 矩阵 
vout .NormalN = mul(vin.NormalL, (float3x3)gWorld); 














// 将 顶点 变换 到 齐 次 裁剪 空间 
vout .PosH = mul(posW, gViewpPro]j); 








// 为 了 对 三 角形 进行 插值 操作 而 输出 的 顶点 属性 
float4 texC = mul(float4(vin.TexC，6.6f，1.6f)，gTexTransform) ; 
vout.TexC = mul(texC，8gMatTransform) .xy; 





return vout; 


} 


float4 PS(VertexOut pin) : SV_Target 


{ 
float4 diffuseAlbedo = gDiffuseMap.Sample(gsamAnisotropicWrap, 


pin.TexC) * gDiffuseAlbedo; 





























// 对 法 线 插值 可 能 使 之 非 规 范 化 ， 因 此 要 对 它 再 次 进行 规范 化 处 理 


pin.NormalW = normalize(pin.NormalW); 














// 光线 经 表面 上 一 点 反射 到 观察 点 这 一 方向 上 的 向 量 
float3 toEyeW = normalize(gEyePosW - pin.PosW); 














// 光照 项 
float4 ambient = gAmbientLight*diffuseAlbedo; 


const float shininess = 1.6f - gRoughness ; 

Material mat = { diffuseAlbedo，gFresnelR6，shininess }; 

float3 shadowFactor = 1.6f; 

float4 directLight = ComputeLighting(gLights, mat, pin.PosW, 
pin.NormalW, toEyeW, shadowFactor); 


float4 litColor = ambient + directLight; 





// 从 漫 反 射 反 照 率 获取 alpha 值 的 常见 手段 
litColor.a = diffuseAlbedo.a; 


return litColor; 





9.10 ”纹理 变换 


我 们 还 未 曾 讨 论 过 第 量 缓冲 区 变量 gTexTransform 
ae 这 两 个 变量 用 于 在 顶点 着 色 器 中 对 输入 的 纹理 坐标 


进行 变换 : 














// 为 三 角形 插值 而 输出 顶点 属性 


float4 texC = mul(float4(vin.TexC，6.6f，1.6f)，gTexTransform) ; 
vout.TexC = mul(texC, gMatTransform) .xy 





纹理 坐标 表示 的 是 纹理 平面 中 的 2D 点 。 有 了 这 种 坐标 ， 我 们 就 能 
像 其 他 的 2D 点 一 样 ， 对 纹理 中 的 样 点 进行 缩放 、 平 移 与 旋转 。 下 面 是 
一 些 适 用 于 纹理 变换 的 示例 : 


1. 令 砖 块 纹理 随 厦 一 堵 墙 的 模型 而 拉 伸 。 假 设 此 载 项 点 的 当前 纹 
理 坐 标 范 围 为 [0, 1]。 在 将 该 纹理 坐标 放大 4 倍 使 它们 变换 到 范围 [0, 4] 
时 ， 该 砖 块 纹理 将 沿 着 增 面 重复 贴图 4 x 4 次 。 








2. 假设 有 许多 云 末 纹理 绢 延 在 万 里 无 云 的 碧空 背景 之 下 ， 那 么 ， 
通过 随 着 时 间 函 数 来 平移 这 些 纹理 的 坐标 ， 便 能 实现 动态 的 白云 浮 过 启 





3. 纹理 的 旋转 操作 有 时 也 便于 实现 一 些 类 似 于 粒子 的 效果 。 例 
如 ， 可 以 随 看 时 间 的 推移 而 令 火 球 纹理 进行 旋转 。 

在 “Crate”( 板 条 箱 ) 演示 程序 中 ， 我 们 实际 上 是 采用 单位 矩阵 进行 
变换 ， 也 就 是 说 ， 并 没有 对 输入 的 纹理 坐标 进行 任何 修改 。 但 是 ， 在 下 





一 节 里 ， 我 们 会 讲解 一 种 使 用 纹理 变换 的 示例 。 


注意 ， 变 换 2D 纹 理 坐 标 要 利用 4 x 4 矩阵 ， 因 此 我 们 先 将 它 扩充 为 
一 个 4D 向 量 : 


vin.TexC ---> float4(vin.TexC，6.9f，1.6f) 


在 完成 乘法 运算 之 后 ， 从 得 到 的 4D 向 量 中 去 掉 : 分 量 与 ww 分量， 使 
之 强制 转换 回 2D 向 量 ， 即 : 


float4 TexC = mul(float4(vin.TexC, 60.6f, 1.6f), gTexTransform); 





vout.TexC = mul(texC, gMatTransform) .xy; 


在 此 ， 我 们 运用 了 两 个 独立 的 纹理 变换 窍 阵 gTexTransform 
与 gMatTransform， 这 样 做 是 因为 一 种 是 天 于 材质 的 纹理 变换 (针对 像 
水 那样 的 动态 材质 ) ， 另 一 种 是 关于 物体 属性 的 纹理 变换 。 


由 于 这 里 使 用 的 是 2D 纹 理 坐 标 ， 所 以 我 们 只 关心 前 两 个 坐标 轴 的 
变换 情况 。 例 如 ， 如 果 纹 理 矩 阵 平 移 了 :坐标 ， 这 并 不 会 对 纹理 坐标 造 
成 任何 影响 。 





9.11 附 有 纹理 的 山川 演示 程序 


在 此 演示 程序 中 ， 我 们 癌 陆地 与 河流 的 场景 中 添加 了 纹理 。 首 先 要 
解决 的 问题 是 向 陆地 铺设 草地 纹理 。 由 于 陆地 的 网 格 是 一 个 块 极 大 的 曲 
面 ， 寿 简单 地 沿 着 它 的 形状 在 上 面 拉 伸 纹理 ， 将 导致 每 个 三 角形 仅 分 配 
到 极 少 的 纹 素 。 换 句 话说 ， 此 做 法 并 没有 给 予 表面 足够 的 纹理 分 辩 率 ， 
所 以 最 终 只 能 得 到 纹理 放大 的 失真 效果 。 因 此 ， 这 时 就 要 通过 同 陆 地 网 
格 重复 铺设 草地 纹理 来 获取 更 高 的 分 辩 率 。 第 二 个 关键 问题 则 是 根据 时 
间 函 数 令 水 流 纹 理 沿 波浪 几何 体 深 〔“ 流 ”) 动 起 来 。 添 加 此 项 动作 可 使 
流水 的 效果 更 加 逼真 。 图 9.15 为 此 演示 程序 的 效果 。 











Dd3dAp» fps: 50.000000 mspf: 16.665666 





图 9.15 ”山川 纹理 例 程 的 效果 


9.11.1 和 生成 栅 格 纹理 坐标 


图 9.16 左 侧 所 示 的 是 一 个 位 于 平面 zz 内 的 mm x n 顶 格 ， 右 侧 则 是 在 归 
一 化 纹理 坐标 域 0, 中 与 之 对 应 的 栅 格 。 从 图 中 可 以 明显 地 看 出 ，zz 平 
面 内 的 栅 格 顶点 纹理 坐标 与 纹理 坐标 系 中 的 栅 格 顶点 坐标 一 一 对 应 。 纹 
理 坐 标 系 中 第 ; 行 、 第 j 列 的 顶点 坐标 为 : 





ui; = 7* Au 
Ui = 1* Am 
















































































图 9.16 Zz 空间 内 棚 格 顶点 ?的 纹理 坐标 对 应 于 uv 纹理 坐标 系 中 棚 格 顶点 的 坐标 








据 此 ， 我 们 就 可 以 通过 下 列 GeometryGenerator::CreateGrid 方 
法 来 生成 栅 格 的 纹理 坐标 。 





GeometryGenerator: :MeshData 
GeometryGenerator: :CreateGrid(float width, float depth, uint32 m, uint32 n 
) 


{ 
MeshData meshData; 


uint32 vertexCount = m*n; 
uint32 faceCount = (m-1)*(n-1)*2; 


float halfWwidth 
float halfDepth 


0.5f*width; 
8.5fkdepth ; 


float dx = width / (n-1); 
float dz = depth / (m-1); 
float du = 1.6f / (n-1); 
float dv = 1.6f / (m-1); 


meshData.Vertices.resize(vertexCount); 
for(uint32 i = 06; i < m; ++i) 


float z = halfDepth - i*dz; 
for(uint32 j = 6; j < nj ++j) 
{ 

float x = -halfWidth + j*dx; 


meshData.Vertices[i*n+j].Position = XMFLOAT3(x, 8.6f, z); 
meshData.Vertices[i*n+j].Normal = XMFLOAT3(6.6f, 1.6f, 06.6f); 
meshData.Vertices[i*n+j].TangentU = XMFLOAT3(1.6f, 68.6f, 90.6f); 














// 根据 栅 格 拉 伸 纹理 
meshData.Vertices[i*n+j] .TexC.X 
meshData.Vertices[i*n+j].TexC.y 











j*du; 
i*dyv; 





9.11.2 ”铺设 纹理 


正如 之 前 所 述 ， 我 们 现 要 在 陆地 网 格 上 铺设 草丛 纹理。 但 是 到 目前 
为 止 ， 我 们 所 计算 的 纹理 坐标 仅 限于 单位 域 0, 内 ， 所 以 仅 任 这 一 点 还 
无 法 完成 纹理 的 铺设 。 为 此 ， 我 们 要 指定 重复 寻 址 模式 ， 并 通过 纹理 变 
换 矩 阵 使 纹理 坐标 按 比 例 放大 5 倍 。 如 此 一 来 ， 纹 理 坐 标 就 将 被 映射 到 
区 间 [0, 引 之 中 ， 而 纹理 也 就 可 以 在 陆地 网 格 曲面 上 铺设 5 x 5 次 : 











void TexWavesApp::BuildRenderItems() 
{ 
auto gridRitem = 
gridRitem->World = MathHelper::Identity4x4(); 


std: :make_ unique<RenderItem>(); 


XMStoreFloat4x4(&gridRitem->TexTransform, 
XMMatrixScaling(5.6f, 5.6f, 1.06f)); 





9.11.3 ”纹理 动画 


为 了 使 水 流 纹 理 〈 可 以 像 深 动 广告 那样 ) 顺 着 波浪 几何 体 深 动 播 
放 ， 我 们 要 在 每 个 更 新 周期 中 调用 AnimateMaterials 方 法 ， 以 此 根据 
时 间 函 数 在 纹理 平面 内 平移 纹理 坐标 。 每 帧 中 的 位 移 量 要 小 ， 这 样 可 以 
使 动画 看 上 去 更 加 平滑 流畅 。 我 们 用 无 颖 纹理 投 重 复 寻 址 模式 进行 贴 
图 ， 这 样 束 能 沿 肴 纹理 华 标 系 平面 接连 不 断 并 不 露 痕 迹地 平移 纹理 坐 
标 。 下 列 代码 演示 了 我 们 是 如 何 来 计算 水 流 纹 理 的 偏 移 向量 ， 且 如 何 来 
构建 并 设置 流水 的 纹理 矩阵 。 





























void TexWavesApp::AnimateMaterials(const GameTimer& gt) 


{ 
// 使 水 流 材 质 的 纹理 坐标 深 动 起 来 


auto waterMat = mMaterials["water"].get(); 




















float& tu 
float& tv 


waterMat->MatTransform(3, 0); 
waterMat->MatTransform(3, 1); 


tu += 6.1f * gt.DeltaTime(); 
tv += 6.62f * gt.DeltaTime(); 


if(tu >= 1.6f) 
tu -= 1.6f; 


if(tv >= 1.6f) 


tv -= 1.6f; 
waterMat->MatTransform(3，68) = tu; 
waterMat->MatTransform(3，1) = tv; 























// 材质 已 发 生变 化 ， 因 而 需要 更 新 向 量 缓冲 区 


waterMat->NumFramesDirty = gNumFrameResources ; 








9.12 小 结 
1. 纹理 坐标 用 于 定义 将 要 映射 到 3D 三 角形 上 的 纹理 三 角形 。 


2. 对 于 游戏 而 言 ， 创 建 纹理 的 常用 方法 是 ， 请 贴图 师 在 Photoshop 
或 一 些 其 他 的 图 像 编 辑 器 中 进行 创作 ， 并 将 结果 存 为 某 种 图 像 文 件 ， 如 
BMP、DDS、TGA 或 PNG。 接 着 ， 游 戏 应 用 程序 会 在 加 载 资源 期 间 将 图 
像 数据 载 入 ID3D12Resource 对 象 。 对 于 实时 图 形 应 用 程序 来 说 ， 

DDS 〈DirectDraw 图 面 格式 ) 图 像 文件 是 极 好 的 选择 ， 因 为 它 文 持 各 种 
GPU 本 身 即 可 处 理 的 图 像 格 式 ， 以 及 GPU 可 原生 解压 的 压缩 图 像 格 式 。 








3. 有 两 种 将 传统 图 像 格 式 转 换 为 DDS 格 式 的 常用 方法 : 使 用 图 像 
编辑 器 或 借助 一 种 微软 公司 提供 的 名 为 texconv 的 命令 行 工 具 导 出 DDS 格 
TW 

4. 我 们 能 够 通过 CreateDDSTextureFromFile12 函 数 以 存 于 磁盘 


中 的 图 像 文 件 来 创建 纹理 ， 此 函数 位 于 DVD 中 的 
Common/DDSTextureLoader.h/.cpp 文 件 。 











5. 当 放 大 物体 表面 并 试图 以 少数 纹 素 来 敢 闸 大量 屏 幕 像 素 时 ， 便 
会 涉及 纹理 放大 (magnification〉 的 问题 。 而 当 缩 小 物体 表面 并 尝试 令 
大 量 纹 系 履 盖 少数 屏 幕 像 系 时 ， 就 会 进行 纹理 缩小 (minification ) 的 相 
关 操 作 。mipmap 与 纹理 过 滤器 是 处 理 纹理 放大 与 缩小 这 两 种 操作 的 关 
键 技术 。GPU 原 生 文 持 3 种 纹理 过 滤器 《根据 质量 由 低 到 高 、 开 销 由 廉 
至 贵 的 顺序 来 排列 ) ， 即 点 过 滤器 、 线 性 过 滤器 以 及 各 向 异性 过 滤器 。 





6. 纹理 的 寻 址 模式 定义 了 Direct3D 将 如 何 处 理 超出 范围 [0, 1] 外 的 
纹理 坐标 。 例 如 ， 对 于 那些 超出 范围 的 纹理 ， 完 竟 是 应 当 采 取 平 铺 、 镜 
像 ， 还 是 钳 位 或 其 他 处 理 方式 呢 ? 


7. 我 们 可 以 像 变换 普通 点 那样 ， 利 用 纹理 坐标 对 纹理 进行 缩放 、 
旋转 以 及 平移 。 通 过 在 每 一 帧 中 小 幅度 渐进 地 变换 纹理 坐标 ， 便 可 以 实 
现 纹 理 的 动画 效果 。 


9.13 练习 


1. 尝试 修改 “Crate”( 板 条 箱 ) 演示 程序 中 的 纹理 坐标 ， 并 采用 不 
同 的 寻 址 模式 与 过 滤 选 项 来 开展 试验 。 特 别 是 要 再 现 图 9.7、 图 9.9 一 图 
9.13 中 的 效果 。 


2. 通过 使 用 DirectX 纹 理工 具 (DirectX Texture Tool) [ 吴 ， 我 们 就 
能 自己 来 指定 每 个 mipmap 层 级 〈EFile - Open Onto This Surface) 。 创 
哇 一 个 具有 如 图 9.17 中 所 示 mipmap 链 的 DDS 文 件 ， 在 每 一 层级 中 附 有 不 
同 的 文字 说 明 或 颜色 能 便于 我 们 区 分 出 每 一 个 mipmap 层 。 通 过 此 纹理 
来 代 蔡 Crate 演 示 程 序 中 的 原 纹理 后 ， 在 镜头 拉 近 或 远离 板 条 箱 的 过 程 
中 ， 我 们 便 能 明显 地 看 出 mipmap 层 级 的 变化 。 最 后 ， 分 别 尝 试 mipmap 
的 点 过 滤 与 线性 过 滤 ， 并 观察 效果 。 


3. 给 出 两 个 相同 大 小 的 纹理 ， 我 们 可 以 通过 各 种 不 同 的 处 理 方 式 
将 它们 合成 为 一 个 新 的 图 像 。 一 般 来 讲 ， 这 种 将 多 个 纹理 合 而 为 一 的 方 
法 称 为 多 重 纹理 贴图 (multitexturing) 。 例 如 ， 我 们 可 以 对 两 个 纹理 中 
相应 的 纹 际 进行 加 、 减 或 〈 分 量 式 ) 乘法 运算 。 图 9.18 展 示 了 通过 将 两 
种 纹理 进行 分 量 式 乘法 来 获取 火球 效 末 的 过 程 。 在 本 练习 中 要 修改 的 
是 “Crate” 演 示 程 序 ， 用 像素 着 色 占 令 图 9.18 内 所 示 的 两 种 原始 纹理 系 材 
组 合 为 火球 纹理 ， 并 将 其 映射 到 每 个 立方 体 的 表面 上 《此 练习 中 的 图 像 
文件 可 以 从 本 书 的 配套 网 站 上 下 载 li) 。 注 意 ， 我 们 需要 修 
改 Defauithisl 文 件 来 文 持 处 理 多 个 纹理 。 








图 9.17 手动 构建 的 mipmap 链 ， 这 样 一 来 每 个 层级 都 能 看 得 通 透 


| 系 | 革 


图 9.18 通过 使 两 个 纹理 中 的 对 应 纹 素 逐 分 量 相 乘 来 生成 一 个 新 的 纹理 























4. 修改 练习 3 的 解答 方案 ， 使 每 个 立方 体 表面 上 的 火球 纹理 随 着 时 
司 图 数 而 旋转 。 


5. 设 皮 Po、P1 与 P2 为 三 角形 的 项 点， 而 且 它 们 分 别 对 应 于 纹理 坐标 
4q0o、91 和 42。 回顾 第 9.2 节 可 知 ， 当 s > 0 上 > 0 s+t < 1 时 ， 对 于 3D 三 角 
形 中 任意 一 点 Pls; = Po + stP1 一 Po) +t(p2 一 Po)， 我 们 可 用 同样 的 参数 s 
、t， 通 过 对 3D 三 角形 顶点 纹理 坐标 进行 线性 插值 来 求 出 其 纹理 坐标 


(1 v ). 
(u,v) = go+s(qi ~— qo) 十 大 gu — qo) 


(a) 给 出 Wo) 以 及 go、91 和 92， 用 * 与 来 表示 ts: tj。 (提示 : 考虑 


向 量 方程 u,v) = qo +s(qi — qo) +t(q,— qo), ) 


(b) 将 P 表 示 为 由 u 与 v 作 为 自 变量 的 函数 ， 即 求 出 公式 P = Pt 





Cc) 计算 9P/0u 与 9P/d0， 并 解释 这 些 向 量 的 几何 意义 。 





6. 修改 第 8 章 中 的 “LitColumns” 演 示 程 序 ， 同 场景 中 的 地 面 、 立 柱 
以 及 球体 添加 纹理 (营造 图 9.19 中 的 效果 〉 。 这 些 纹理 可 在 本 章 的 代码 
目录 中 找到 。 间 








图 9.19 ”对 场景 中 的 物体 进行 贴图 后 的 效果 





[1] 排除 一 些 特殊 的 情况 ， 这 里 所 说 的 “ 阜 阵 ? 可 看 作 是 存 有 纹理 数据 元 
素 的 2D 数 组 。 








[2] 纹理 空间 这 个 提 法 不 太 好 ， 容 易 与 第 19.3 节 中 的 切 空间 《〈 亦 称 纹理 
空间 ) 混 消 。 


[3] 最 新 版 的 texconv 与 texassemble 工 具 可 从 微软 GitHub 上 名 为 
DirectXTex 的 工程 中 找到 。 


[4] 在 翻译 这 上 段 话 的 时 候 ， 已 有 文 持 DirectX 12 的 相关 代码 了 。 读 者 可 
在 微软 的 GitHub 中 查找 DirectXTK12， 其 中 有 对 应 版 本 的 
DDSTextureLoader.h/cpp 文 件 。 


[5] 过 滤器 ， 即 filter。 由 于 纹理 过 滤 以 及 后 面 会 提 到 的 高 斯 模糊 等 〈 其 
实 还 包括 反 锯齿 等 许多 与 图 形 相关 的 技术 ) 在 本 质 上 都 运用 的 是 信号 处 
理 技术 ， 因 此 有 时 将 其 译作 “滤波 器 ”。 考 虑 到 从 效果 上 来 划分 的 话 ， 有 
时 也 称 高 斯 模糊 等 为 “ 滤 镜 ”。 





[6] 有 些 文献 将 mipmap 写 作 mip-map 或 直接 作 mip map， 这 样 一 看 比较 
直观 。 可 见 它 也 是 一 种 “图 ”， 但 是 这 是 一 种 由 一 组 内 容 相 同 大 小 不 同 的 
图 所 构成 的 “图 ”。 


[7] DirectX Texture Tool 的 程序 名 为 DxTex.exe， 是 DirectX 10 之 前 的 产 
物 ， 官 方 网 站 已 不 再 建议 使 用 此 工具 。 其 实 此 程序 随 DirectX 的 更 蔡 也 
有 许多 版 本 ， 每 个 版 本 都 有 或 多 或 少 的 bug， 但 是 最 严重 问题 的 还 是 不 
文 持 DirectX 9 后 新 出 的 图 像 格式 。 其 优点 便 是 可 视 化 且 易 于 操作 。 它 是 
老 版 DirectX SDK 中 的 一 部 分 ， 所 以 要 使 用 就 需 装 整个 DK。 网 上 独立 
提取 出 来 的 版 本 都 比较 低 ， 如 果 读 者 当真 要 用 的 话 ， 小 的 推荐 使 用 
GitHub 中 SourceEngine2007 工 程 的 DxTex.exe 版 本 。 原 作者 在 此 项 目 中 附 
有 许多 有 用 的 工具 ， 版 本 也 比较 新 ， 而 且 源 码 也 提取 出 来 了 了 ， 可 以 自己 
动手 丰衣足食 ， 修 改 bug、 添 加 图 像 格式 等 。 而 DXSDK_Jun10.exe 是 最 
后 一 版 独立 的 DirectX SDK， 从 Windows 8 开始 DirectX SDK 便 归于 
Windows SDK。 到 了 Visual Studio 2015 这 个 版 本 ， 它 已 内 置 能 够 简单 编 
辑 图 像 的 程序 ， 可 以 将 图 片 放 进去 试 一 试 。 在 DirectX 12 这 个 版 本 中 ， 





DDS 文 件 的 处 理 则 交 由 DirectXTex 库 ， 再 辅 以 其 他 轻 量 级 程序 配合 使 
用 。 这 些 常 用 的 程序 有 文中 所 述 的 用 于 转换 图 像 格 式 的 Texconv， 创 建 
立方 体 图 、 体 贴图 以 及 纹理 数组 的 Texassemble， 还 有 查看 DDS 图 像 的 
DDSView 等 。 简 单 来 说 ， 此 版 本 以 DirectXTex 库 为 核心 的 命令 行 工具 集 
代替 了 旧版 本 的 可 视 化 DxTex。 另 外 ， 本 书 所 推荐 的 NVIDIA 版 
Photoshop 插 件 也 有 格式 支持 不 完整 的 问题 ， 而 微软 官方 GitHub 则 提 和 到 
男 一 款 由 Intel 制 作 的 名 为 Texture Works Plugin 的 Photoshop 插 件 ， 而 且 它 
也 基于 DirectXTex 库 。 


[8] 这 两 种 纹理 可 在 本 书 前 一 版 的 源 代 码 压 缩 包 d3d11CodeSet1.zip 的 第 
8 章 中 找到 ， 名 称 分 别 为 flare.dds 和 flarealpha.dds 。 


[9] ”本 书 的 纹理 都 统一 放 在 Textures 文 件 夹 中 。 若 所 需 纹 理 不 在 其 中 ， 
可 以 如 之 前 所 说 在 此 书 前 一 版 源 代码 的 相应 章节 中 寻找 。 


先 来 观察 一 下 图 10.1。 我 们 在 泻 染 此 帧 画面 时 先后 绘制 了 地 形 与 木 
板 箱 《〈 构 成 箱子 在 前 、 地 形 在 后 的 效 末 ) ， 使 这 两 种 材质 的 像素 数据 都 
位 于 后 台 绥 冲 区 中 。 接 着 再 运用 混合 技术 将 水 面 绘制 到 后 全 缓冲 区 ， 令 
水 的 像素 数据 与 地 形 以 及 板 条 箱 这 两 种 像素 数据 在 后 台 绥 冲 区 内 相 泥 
合 ， 构 成 可 以 透 过 水 看 到 地 形 与 板 条 箱 的 效果 。 本 章 将 研究 混合 
(blending， 也 译作 融合 技术 ， 它 使 我 们 可 以 将 当前 要 光栅 化 (又 名 
为 源 像 系 ，source pixel) 的 像素 与 之 前 已 光栅 化 至 后 台 绥 冲 区 的 像素 
《目标 像 兹 ，destination pixel) 相 融 合 。 因 此 ， 该 技术 可 用 于 泻 染 如 水 
与 玻璃 之 类 的 半 透 明 物 体 。 








图 10.1 半 透 明 效果 的 水 面 


为 了 便于 讨论 ， 我 们 将 此 处 谈 及 的 后 从 缓冲 区 视 为 泻 染 目标 ， 而 在 
本 书 的 后 面 还 会 展示 将 物体 泻 染 至 “ 离 屏 ”(off screen) 的 演 染 目标 之 
中 。 在 这 两 种 演 染 目标 中 所 运用 混合 技术 其 实 并 没有 什么 区 别 ， 而 位 于 
离 屏 演 染 目标 中 的 目标 像素 也 是 经 此 前 光栅 化 处 理 后 的 像素 数据 而 已 。 








学 习 目 标 : 

1. 理解 混合 技术 的 工作 原理 ， 并 且 在 Direct3D 中 运用 此 技术 。 
2. 学 习 Direct3D 所 文 持 的 不 同 混合 模式 。 

3. 探 守 如何 用 alpha 分 量 来 调节 图 元 的 透明 度 。 


4. 学 会 仅 通过 调用 HLSL 中 的 cLip 函 数 来 阻止 向 后 台 缓冲 区 中 绘制 
像素 。 


10.1 混合 方程 


设 Cse 为 像素 着 色 器 输出 的 当前 正在 光栅 化 的 第 ; 行 、 第 7 列 像素 
〈 源 像 系 ) 的 颜色 值 ， 再 设 Cds 为 目前 在 后 台 绥 冲 区 中 与 之 对 应 的 第 ; 
行 、 第 7 列 像素 “目标 像素 ) 的 颜色 值 。 若 不 用 混合 技术 ，Csre 将 直接 顽 
写 Cdt〈 假 设 此 像素 已 经 通过 深度 /模板 测试 ) ， 而 令 后 台 组 冲 区 中 人 第; 
行 、 第 ] 列 的 像素 变更 为 新 的 颜色 值 Csc。 但 是 ， 夺 使 用 了 混合 技术 ， 则 
Csrc 与 Cdst 将 融合 在 一 起 得 到 新 颜色 值 C 后 再 窗 写 Cast (即将 两 者 的 混合 
颜色 C 写 入 后 台 组 冲 区 的 第 ; 行 、 第 7 列 像素 ) 。Direct3D 使 用 下 列 混合 


方程 来 使 源 像素 颜色 与 目标 像素 颜色 相 融 合 : 








C = C src Das 下 src 田 Cdst ~ 下 dst 











在 第 10.3 节 中 将 介绍 Esc 〈 源 混合 因子 ) 与 Fast (目标 混合 因子 ) 会 
使 用 到 的 具体 值 ， 通 过 这 两 种 因子 ， 我 们 就 能 够 用 各 种 数值 来 调整 源 像 
素 与 目标 像素 ， 以 获取 各 种 不 同 的 效果 。 运 算 符 “2”* 表 示 在 5.3.1 节 中 人 针 
对 颜色 向 量 而 定义 的 分 量 式 乘法 ， 而 * 田 ? 则 表示 在 10.2 节 中 定义 的 二 元 
运算 符 











上 述 混 合 方程 仅 用 于 控制 颜色 的 RGB 分 量 ， 而 alpha 分 量 实则 由 类 
似 于 下 面 的 方程 来 单独 处 理 : 


4 = 4arcFsr 田 ds Fas 





这 两 组 方程 本 质 上 都 是 相同 的 ， 但 区 别 在 于 混合 因子 与 二 元 运算 可 





能 有 所 差异 。 将 RGB 分 量 与 alpha 分 量 分 离开 来 的 动机 也 比较 简单 ， 就 
征 希 望 能 独立 地 处 理 两 者 ， 来 尽 可 能 多 地 产生 不 同 的 混合 变化 效果 。 








注 意 Note a 


alpha 分 量 的 混合 需求 远 少 于 RGB 分 量 的 混合 需求 。 这 主要 是 由 于 
我 们 往往 并 不 关心 后 台 绥 冲 区 中 的 alpha 值 。 而 仅 在 一 些 对 目标 aljpha 值 
(destination alpha〉 有 特定 要 求 的 算法 之 中 ， 后 台 绥 冲 区 内 的 alpha 值 才 
显得 至 关 重 要 。 























下 列 枚 举 项 成 员 将 用 作 混 合 方程 中 的 二 元 运算 


田 : 


BAe 
x 


typedef enum D3D12 BLEND_ OP 


D3D12 BLEND OP ADD = 1, C= Cgc® FocCast B Fads 
D3D12 BLEND OP_ SUBTRACT = 2, C= Cast® Prast 一 Cs 四 下 


D3D12_BLEND_ OP_REV_SUBTRACT = 3， C=Csc® Fs — Cast 区 
D3D12 BLEND OP MIN = 4， C = min(Csre, Cas) 


D3D12_BLEND OP MAX = 5， C = max(Csre, Cast) 
} D3D12_BLEND_OP; 





在 求 取 最 小 值 或 最 大 值 (min/max) 的 运算 中 会 忽略 混合 因子 。 


运算 符 也 同样 适用 于 alpha 混 合 运 算 。 而 且 ， 我 们 还 能 同时 为 
es 文 两 种 运算 分 别 指定 不 同 的 运算 符 。 例 如 ， 可 以 像 下 面 一 
样 使 两 个 RGB 项 相 加 ， 却 令 两 个 alpha 项 相 减 : 


C 一 C'src ~ Ferc TT Cdst 2 Fdst 
A = Adst Fdst 一 /grc /grc 


Direct3D 从 最 近 几 版 开始 加 入 了 一 项 新 特性 ， 通 过 逻辑 运算 符 对 源 
颜色 和 目标 颜色 进行 混合 ， 用 以 取代 上 述 传统 的 混合 方程 。 这 些 逻 辑 运 


算 符 如 下 : 


typedef 
enum D3D12 LOGIC OP 
{ 
D3D12 LOGIC OP CLEAR = 6， 
D3D12 LOGIC OP_SET = ( D3D12 LOGIC OP CLEAR + 1 ) ， 
D3D12 LOGIC OP COPY = ( D3D12 LOGIC OP SET + 1 ) ， 
D3D12 LOGIC OP_COPY_INVERTED = ( D3D12 LOGIC OP COPY + 1 ) ， 
D3D12 LOGIC OP NOOP = ( D3D12 LOGIC OP COPY INVERTED + 1 ) ， 
D3D12 LOGIC OP_INVERT D3D12 LOGIC OP NOOP + 1 ) ， 
D3D12_LOGIC OP_AND D3D12 LOGIC OP INVERT + 1 )， 
D3D12_LOGIC OP_NAND D3D12 LOGIC OP AND + 1 ) ， 
D3D12 LOGIC OP_OR D3D12 LOGIC OP NAND + 1 ) ， 
D3D12_LOGIC OP_NOR D3D12 LOGIC OP OR + 1 ) ， 
D3D12_LOGIC OP_XOR = ( D3D12 LOGIC OP NOR + 1 ) ， 
D3D12_LOGIC OP_EQUIV ( D3D12 LOGIC OP XOR + 1 )， 
D3D12 LOGIC OP_ AND REVERSE ( D3D12 LOGIC OP EQUIV + 1 ) ， 
D3D12 LOGIC OP AND INVERTED = ( D3D12 LOGIC OP AND REVERSE + 1 ) ， 
D3D12 LOGIC OP OR REVERSE = ( D3D12 LOGIC OP AND INVERTED + 1 ) ， 
D3D12 LOGIC OP_OR_INVERTED ( D3D12 LOGIC OP OR REVERSE + 1 ) 
} D3D12_ LOGIC OP; 





注意 ， 不 能 同时 使 用 传统 混合 方程 与 逻辑 运 算 符 这 两 种 混合 手段 ， 
两 者 只 能 择 其 一 。 另 外 需要 指出 的 是 ， 为 了 使 用 逻辑 运算 符 混 合 技术 ， 
就 一 定 要 选择 它 所 文 持 的 演 染 目标 格式 一 一 这 个 格式 应 当 为 UINT《〈 无 
符号 整数 ) 的 有 关 类 型 ， 否 则 我 们 会 收 到 类 似 于 下 面 的 错误 提示 信息 : 





D3D12 ERROR: ID3D12Device::CreateGraphicspPipelineState: The render 
target format at Slot 6 is format (R8G8B8A8 UNORM). This format 

does not support logic ops. The Pixel Shader output signature 

indicates this output could be written，and the Blend State indicates 
logic op is enabled for this slot. [ STATE_CREATION ERROR #678: 
CREATEGRAPHICSPIPELINESTATE OM RENDER TARGET DOES NOT_ SUPPORT_ LOGIC OPS 


] 


D3D12 WARNING: ID3D12Device::CreateGraphicspipelineState: Pixel Shader 
output 'SV_Target@' has type that is NOT unsigned int, while the 
corresponding Output Merger RenderTarget slot [6] has logic op enabled. 
This happens to be well defined: the raw bits output from the shader 
will simply be interpreted as UINT bits in the blender without any data 


conversion. This warning is to check that the application developer 
really intended to rely on this behavior. [ STATE_CREATION WARNING 
#677: CREATEGRAPHICSPIPELINESTATE PS OUTPUT_TYPE MISMATCH] 

















(D3D12 错 误 : ”ID3D12Device: :CreateGraphicsPipelineState: ”位 于 6 槽 位 的 演 染 目 
标 格式 为 《R8G8B8A8_UNORM) 。 逻 辑 运 算 不 支持 此 格式 。 像 素 着 色 器 的 输出 签名 指示 可 以 问 
此 输出 项 执行 写 操作 ， 而 且 混合 状态 表明 此 槽 位 启用 的 是 逻辑 运算 。[ STATE_CREATION ER 
ROR #678 : CREATEGRAPHICSPIPELINESTATE ”0OM_RENDER_TARGET_DOES_NOT_SUPPORT_LO 
GIC_OPS] 













































































D3D12 人 警告; ID3D12Device: :CreateGraphicsPipelineSstate: 像素 着 色 器 输出 项 ‘SvV_Ta 
rget6" 存在 非 无 符号 整数 类 型 ， 而 它 相 应 的 输出 合并 演 染 目标 槽 [6] 却 已 经 启用 了 逻辑 运算 
。 关 于 此 事件 的 发 生 系统 中 有 着 明确 的 定义 : 从 着 色 器 输出 的 原始 二 进 制 数据 在 混合 器 中 将 





































































































不 进行 任何 的 数据 转换 ， 而 是 简单 地 解释 为 UINT 二 进 制 数据 。 此 警告 是 为 了 核实 应 用 程序 开 
发 者 是 否 遵循 此 行为 。[STATE_CREATION WARNING #677:CREATEGRAPHICSPIPELINESTATE 
”PSs_OUTPUT_TYPE_MISMATCH] ) 























10.3 ”混合 因子 











通过 为 源 混合 因子 与 目标 混合 因子 分 别 设 置 不 同 的 混合 运算 符 ， 束 
可 以 实现 各 式 各 样 的 混合 效果 。 我 们 会 在 10.5 节 中 详解 这 些 组 合 ， 但 是 
需要 先 来 体验 一 下 不 同 的 混合 因子 并 感受 它们 实际 的 计算 方式 。 下 面 列 
举 描述 的 是 基本 的 混合 因子 ， 可 以 将 它们 应 用 于 Fe 与 Rdat。 关 于 其 他 
更 加 高 级 的 混合 因子 ， 读 者 可 参考 SDK 文 档 中 的 D3D12_BLEND 枚 举 类 
型 。 设 Csrc = (7s,9s,bs)Asrc = as (从 像素 着 色 器 输出 的 RGBA 值 〉， 
Cdst = (rd 9d,bq)Adst = adu (已 存储 于 演 染 目标 中 的 RGBA 值 ) ，F 为 Fsrc 
或 Fast， 而 是 far 或 fast， 则 我 们 有 : 











D3D12_ BLEND ZERO:F =(0,0,0)HF=0 

D3D12 BLEND ONE:F =(1,1,1)HF=1 

D3D12 BLEND SRC COLOR: F = (7s, 9s, bs) 

D3D12_BLEND INV_SRC COLOR: Fsc = (1 —7s,1— gs,1— bs) 


D3D12 BLEND SRC ALPHA:F = (as,as,as)HF = a;s 





D3D12_ BLEND _INV_SRC _ ALPHA: F=(l—a,l—a,l—as)H 
有 一 (1 一 as) 


D3D12 BLEND DEST ALPHA: F = (ad,44q,aq)HF = ad 


D3D12_BLEND_INV_DEST_ALPHA: 五 = 人 一 ad 一 ad 一 ad) 且 


已 一 (1 一 ad) 


D3D12 BLEND DEST_ COLOR: F = (74d,94,b4d) 


D3D12_BLEND INV_DEST COLOR:F =(1—741— 94,1—04) 


D3D12_BLEND_SRC ALPHA_SAT:=(as,as,as) 有 fF = os， 其 中 
a’'s = clamplas, 0, 1) 

D3D12_BLEND_BLEND_FACTOR: 下 二 (77,9; 四 且 F = a， 其 中 的 颜色 
(7, g,b, a) 可 用 作 方 法 
ID3D12GraphicsCommandList: :OMSetBlendFactor 的 参数 。 通 过 这 











种 方法 ， 我 们 就 可 以 直接 指定 所 用 的 混合 因子 值 。 但 是 在 改变 混合 状态 
(blend state) 之 前 ， 此 值 是 不 会 生效 的 。 








D3D12_BLEND_INV_BLEND_FACTOR: 五 三 人 一 并 一 91 一 世上 且 
F=1 一 a， 这 里 的 颜色 (7,9;,b,4a) 可 用 
作 ID3D12GraphicsCommandList: :OMSetBlendFactor 的 参数 ， 这 使 
我 们 可 以 直接 指定 所 用 的 混合 因子 值 。 然 而 ， 在 混合 状态 变化 之 前 ， 此 
值 保持 不 变 。 








上 述 的 混合 因子 篆 可 运用 于 RGB 混合 方程 。 但 对 于 alpha 混 合 方程 
来 说 ， 却 不 可 使 用 以 _COLOR 作 为 结尾 的 混合 因子 。 





clLamp 函 数 的 定义 为 ; 


Tr,a<r<b 
clamp{(z.a,b)= 4 a,T<a 


b. Tb 


我 们 可 以 用 下 列 函数 来 设置 混合 因子 : 


void ID3D12GraphicsCommandList::OMSetBlendFactor( 
const FLOAT BlendFactor[ 4 ]); 


硅 传 入 nullptr， 则 恢复 值 为 (1, 1, 1 1) 的 默认 混合 因子 。 








前 面 已 经 讨论 过 混合 运算 符 与 混合 因子， 那么 怎样 用 Direct3D 来 设 
置 这 些 数 值 呢 ? 就 像 其 他 的 Direct3D 状 态 一 样 ， 混 合 状态 亦 是 PSO ( 流 
水 线 状态 对 象 ) 的 一 部 分 。 到 目前 为 止 ， 我 们 一 直 使 用 的 都 是 默认 的 混 
合 状态 ， 即 并 没有 局 用 混合 技术 : 





D3D12_GRAPHICS PIPELINE STATE DESC opaquePsoDesc; 
ZeroMemory(&opaquePsoDesc, sizeof(D3D12 GRAPHICS PIPELINE STATE_ DESC)); 


opaquePsoDesc.BlendState = CD3DX12 BLEND DESC(D3D12 DEFAULT); 





为 了 配置 非 默认 混合 状态 ， 我 们 必须 填写 D3D12_BLEND_DESC 结 构 
体 。 该 结构 体 的 定义 如 下 。 


typedef struct D3D12 BLEND DESC { 
BOOL AlphaToCoverageEnable;  // 默认 值 为 False 





BOOL IndependentBlendEnable; // 默认 值 为 False 
D3D12_RENDER_TARGET_BLEND_DESC RenderTarget[8]; 
} D3D12 BLEND DESC; 





1. AlphaToCoverageEnable: 指定 为 tue， 则 启用 alpha-to- 
coverage 功 能 ， 这 是 一 种 在 演 染 叶片 或 门 等 纹理 时 极其 有 用 的 一 种 多 重 
采样 技术 。 知 指定 为 false， 则 禁用 alpha-to-coverage 功 能 。 另 外 ， 要 使 用 
此 技术 还 需 开启 多 重 采 样 〈 即 创建 后 台 绥 冲 区 与 深度 缓冲 区 时 要 启用 多 
重 采 样 ) 。 





2. IndependentBlendEnable: Direct3D 最 多 可 同时 支持 8 个 泻 染 
目标 。 大 此 标志 被 置 为 tue， 即 表明 可 以 回 每 一 个 泻 染 目标 执行 不 同 的 








混合 操作 (不 同 的 混合 因子 、 不 同 的 混合 运算 以 及 设置 不 同 的 混合 禁 
或 开启 状态 等 ) 。 如 果 将 此 标志 设 为 false， 则 意味 着 所 有 的 演 染 目标 均 
使 用 D3D12_BLEND_DESC: :RenderTarget 数 组 中 第 一 个 元 素 所 描述 的 
方式 进行 混合 。 多 演 染 目标 技术 常用 于 高 级 算法 ， 而 现在 我 们 只 假设 每 
次 仅 向 一 个 演 染 目标 进行 绘制 。 








3.， RenderTarget: 具有 8 个 D3D12 RENDER TARGET BLEND _DESC 
元 素 的 数组 ， 其 中 的 第 ;个 元 素描 述 了 如 何 针对 第 i 个 洽 染 目标 进行 混合 
处 理 。 如 果 IndependentBlendEnab1le 被 设置 为 false， 则 所 有 的 浑 染 目 
标 都 将 根据 RenderTarget[6] 的 设置 进行 混合 运算 。 





结构 体 D3D12_RENDER_TARGET_BLEND_DESC 的 定义 如 下 。 


typedef struct D3D12 RENDER TARGET_ BLEND_DESC 





BOOL BlendEnable; // 默认 值 为 False 

BOOL LogicOpEnable; // 默认 值 为 False 

D3D12_BLEND SrcBlend; // 默认 值 为 D3D12_BLEND_ONE 
D3D12_BLEND DestBlend; // 默认 值 为 D3D12_BLEND_ZERO 
D3D12_BLEND_OP Blendop; // 默认 值 为 D3D12_BLEND_OP_ADD 











D3D12_BLEND SrcBlendAlpha; // 默认 值 为 D3D12_BLEND_ONE 

D3D12_BLEND DestBlendAlpha; // 默认 值 为 D3D12_BLEND_ZERO 

D3D12_BLEND_OP BlendOpAlpha; // 默认 值 为 D3D12_BLEND_OP_ADD 

D3D12_LOGIC_OP Logicop;  // 默认 值 为 D3D12_LOGIC _OP_NOOP 

UINT8 RenderTargetWriteMask; // 默认 值 为 D3D12_COLOR_WRITE_ENABLE_ALL 
} D3D12 RENDER TARGET BLEND DESC; 

















1. BlendEnable: 指定 为 tue， 则 启用 常规 混合 功能 ， 指 定 为 
false， 则 禁用 常规 混合 功能 。 注 意 ， 不 能 将 BlendEnable 
与 LogicOpEnable 同 时 置 为 tue， 只 能 从 常规 混合 与 逻辑 运算 符 混 合 两 
种 方式 中 选择 一 种 。 





2. LogicOpEnable: 指定 为 true， 则 启用 逻辑 混合 运算 ， 反 之 则 
反 。 注 意 ， 不 能 将 BlendEnable 和 LogicOpEnable 同 时 设置 为 tue， 只 
能 从 常规 混合 与 逻辑 运算 混合 中 选择 一 种 。 





3. SrcBlend: 枚 举 类 型 D3D12_BLEND 中 的 成 员 之 一 ， 用 于 指定 
RGB 泥 合 中 的 源 混 合 因子 fsre 


4. DestBlend: 枚 举 类 型 D3D12_BLEND 中 的 成 员 之 一 ， 用 于 指定 
RGB 混合 中 的 目标 混合 因子 下 ds。 





5. Blendop: 枚 举 类 型 D3D12_BLEND_oP 中 的 成 员 之 一 ， 用 于 指定 
RGB 混合 口 竺 运 得 体 5 


6. SrcBlendAlpha: 枚 举 类 型 D3D12_BLEND 中 的 一 个 成 员 ， 指 定 
了 alpha 混 合 中 的 源 混合 因子 fsre。 


7. DestBlendAlpha: 枚 举 类 型 D3D12_BLEND 中 的 一 个 成 员 ， 指 
定 了 alpha 混 合 中 的 目标 混合 因子 Fast。 





8. BlendopAlpha: 枚 举 类 型 D3D12_BLEND_0OP 中 的 一 个 成 员 ， 指 
定 了 alpha 混 合 运算 符 。 


9. Logicop: 枚 举 类 型 D3D12 LOGIC_0P 中 的 成 员 之 一 ， 指 定 了 源 
颜色 与 目标 颜色 在 混合 时 所 用 的 逻辑 运算 符 。 


10. RenderTargetWriteMask: 下 列 标志 中 一 种 或 多 种 的 组 合 。 


typedef enum D3D12 COLOR WRITE ENABLE { 


D3D12 COLOR WRITE ENABLE RED = 1 
D3D12 COLOR WRITE ENABLE GREEN = 
D3D12 COLOR WRITE ENABLE BLUE = 4 
D3D12 COLOR WRITE ENABLE ALPHA = 
D3D12 COLOR WRITE ENABLE ALL = 

( D3D12 COLOR WRITE ENABLE RED | D3D12 COLOR WRITE ENABLE GREEN | 
D3D12_ COLOR WRITE ENABLE BLUE | D3D12 COLOR WRITE ENABLE ALPHA ) 
} D3D12_ COLOR WRITE_ ENABLE; 


2 
2， 
2 
8 





这 些 标志 控制 着 混合 后 的 数据 可 被 写 入 后 台 绥 冲 区 中 的 哪些 颜色 通 
道 。 例 如 ， nn ni 
RGB 通 道 的 写 操作 ， 而 仅 写 入 alpha 通 道 的 有 关 数 据 。 对 于 一 些 高 级 技 
le en aati 

返回 的 颜色 数据 将 按 没有 设置 上 述 写 掩 码 来 进行 处 理 〈( 即 不 对 目标 像 
素 执行 任何 操作 ) 。 


注意 Note Wo 


混合 运算 并 非 没 有 开销 ， 它 也 需要 对 每 个 像 系 进行 额外 的 处 理 。 所 
以 只 有 在 需要 的 情况 下 才 使 用 此 技术 ， 否 则 应 禁用 这 项 功能 。 











下 面 的 代码 展示 了 如 何 来 创建 和 设置 混合 状态 。 














// 创建 开启 混合 功能 的 PSO 
D3D12 GRAPHICS PIPELINE STATE DESC transparentPsoDesc = opaquePsoDesc; 


D3D12_ RENDER TARGET_ BLEND DESC transparencyBlendDesc; 
transparencyBlendDesc.BlendEnable = true; 
transparencyBlendDesc.LogicOpEnable = false; 
transparencyBlendDesc.SrcBlend = D3D12 BLEND_ SRC_ ALPHA; 


transparencyBlendDesc.DestBlend = D3D12_BLEND_INV_SRC_ALPHA; 
transparencyBlendDesc.BlendOp = D3D12 BLEND_ OP_ADD; 
transparencyBlendDesc.SrcBlendAlpha = D3D12 BLEND_ ONE; 
transparencyBlendDesc.DestBlendAlpha = D3D12 BLEND_ ZERO; 
transparencyBlendDesc.BlendOpAlpha = D3D12_ BLEND _ OP_ADD; 
transparencyBlendDesc.LogicOp = D3D12 LOGIC OP_NOOP; 
transparencyBlendDesc.RenderTargetWriteMask = D3D12 COLOR WRITE _ ENABLE ALL 


了 


transparentPsoDesc.BlendSstate.RenderTarget[6] = transparencyBlendDesc; 
ThrowIfFailed(md3dDevice->CreateGraphicsPipelinestate( 
&transparentPsoDesc, IID PPV_ARGS(&mpSOs["transparent"]))); 





如 同 其 他 的 PSO 一 般 ， 我 们 应 当 在 应 用 程序 的 初始 化 期 间 来 创建 它 
们 ， 接 着 再 根据 需求 以 
ID3D12GraphicsCommandList::SetPipelineState 方 法 在 不 同 的 状 
态 之 间 进 行 切换 。 





10.5 “混合 示例 


在 下 面 的 各 小 节 中 ， 我 们 将 考查 一 些 用 于 获取 特效 的 混合 因子 组 
合 。 在 这 些 示例 中 ， 我 们 只 关注 RGB 混合 ， 而 alpha 混 合 的 处 理 方法 则 
与 之 相似 。 


10.5.1 禁止 颜色 的 写 操作 





如 采 和 硕 望 使 原始 的 目标 像素 保持 不 变 ， 既 不 对 它 进 行 履 写 ， 也 不 与 
当前 光栅 化 的 源 像素 执行 混合 ， 那 么 这 个 示例 会 非常 适用 。 比 如 说 ， 硅 
不 涉及 后 台 绥 冲 区 ， 而 只 对 深度 /模板 缓冲 区 进行 写 操 作 时 ， 束 把 源 像 
素 的 混合 因子 设置 为 D3D12_BLEND_ZERO， 将 目标 混合 因子 配置 
为 D3D12_BLEND_ONE， 再 令 混 合 运 算 符 为 D3D12_BLEND_OP_ADD 即 可 。 
根据 这 一 系列 设 定 ， 混 合 方程 可 化 简 为 : 


C -= Ce be F'srcEHC dst < Fst 


C = Co. ® (0,0,0) + Cus ® (1,1,1) 

















C= C dst 
这 是 一 个 为 便于 讲解 而 精心 设计 的 示例 。 其 实 还 有 一 种 能 实现 相同 
功能 的 简便 方法 ， 即 将 成 
员 D3D12_RENDER_TARGET_BLEND_DESC: :RenderTargetWriteMask 设 
置 为 0%， 以 此 来 禁止 向 任何 颜色 通道 执行 的 写 操作 。 


10.5.2 ”加 法 混合 与 减法 混合 





如 果 和 希望 令 源 像素 与 目标 像素 实现 加 法 运算 〈 见 图 10.2) ， 那 么 就 
将 源 混 合 因 子 与 目标 混合 因子 同 设 为 D3D12_BLEND_ONE， 再 把 混合 运 
算 符 置 为 D3D12_BLEND_ OP_ADD。 对 于 这 种 配置 而 言 ， 混 合 方程 可 化 简 








C= Csrc® F'srctHC dst ® Fst 
C= C8 (1,1,1) + Cyt ® (1,1,1) 


C= Cre 十 Cdst 
另外 ， 还 可 以 继续 使 用 上 述 混合 因子 ， 唯 令 
D3D12_BLEND_OP_SUBTRACT 来 取代 其 中 的 加 法 混合 运算 符 ， 以 此 来 达 
到 从 目标 像素 中 减 去 源 像素 这 一 目的 ( 见 图 10.3) 。 








图 10.2 令 源 颜色 与 目标 颜色 相 加 。 由 于 加 法 运算 总 体 提升 了 颜色 值 ， 因 而 生成 了 一 张 更 为 明 
亮 的 图 像 


图 10.3 ”从 目标 颜色 中 减 去 源 颜色 。 由 于 减法 运算 移 除了 部 分 颜色 信息 ， 因 而 得 到 的 图 像 更 暗 








10.5.3 ”乘法 混合 


如 果 硕 望 将 源 像 孙 与 其 对 应 的 目标 像素 相 乘 〈 见 图 10.4) ， 那 么 应 
设 源 混 合 因 子 为 D3D12_BLEND_ZERO、 目 标 混合 因子 
为 D3D12_BLEND_SRC_COLOR， 再 将 混合 运算 符 置 
为 D3D12_BLEND_OP_ADD。 据 此 配置 ， 混 合 方程 可 化 简 为 : 








C = Cgc ® ForcC dst 四 下 ds 


C= Csrc ® (0,0,0) 十 Cds @ Cerc 


C= C dst bed Gat 





图 10.4 令 源 颜色 与 目标 颜色 相 乘 


设 源 alpha 分 量 %, 为 一 种 可 用 来 控制 源 像 素 不 透明 度 的 百分比 〈 例 
如 ，alpha 为 0 表示 100% 透 明 ，0.4 表 示 40% 不 透明 ，1.0 则 表示 100% 不 透 
明 ) 。 不 透明 上 度 (opacity) 与 透明 度 (transparency) 的 关系 很 简单 ， 即 
了 =1 一 24， 其 中 的 4 为 不 透明 度 ，7 为 透明 度 。 例 如 ， 帮 物体 的 不 透明 
度 达 0.4， 则 透明 度 为 1 - 0.4 = 0.6。 现 在 ， 假 设 我 们 希望 基于 源 像素 的 
不 透明 度 ， 将 源 像 素 与 目标 像素 进行 混合 。 为 了 实现 此 效果 ， 设 源 混合 
因子 为 D3D12_BLEND_SRC_ALPHA、 目 标 混合 因子 














为 D3D12_BLEND_INV_SRC_ALPHA， 并 将 混合 运算 符 置 
为 DB3D12_BLEND_OP_ADD。 有 了 这 些 配置 ， 混 合 方 程 便 可 化 简 为 : 
C = Curc ® FaercHC dst ® Fast 
CC 一 Crgl(la ad aij 二 Cg@ll 一 ao 1 一 1 一 她) 


COC = aCwc + {1 — as)Cget 


例如 ,假设 4s = 042， 也 就 是 次 ， 源 像素 的 不 透明 度 仅 为 25%。 由 
于 源 像 系 的 透明 上 度 为 75%， 因 此 ， 这 就 是 说 ， 在 源 像 系 与 目标 像 系 混合 
在 一 起 的 时 候 ， 我 们 便 希 望 最 终 颜 色 将 由 25% 的 源 像素 与 75% 的 目标 像 
素 组 合 而 成 (目标 像素 会 位 于 源 像素 的 “后 侧 *”) 。 根 据 上 述 方程 精确 地 
推导 出 下 列 混合 计算 过 程 : 








C= Us 人 i (1 一 ds )Cast 


C = 0.25C， 十 0.75Cv 


借助 此 混合 方法 ， 我 们 就 能 绘制 出 类 似 于 图 10.1 中 那样 的 透明 物 
体 。 需 要 注意 的 是 ， 在 使 用 此 混合 方法 时 ， 还 应 当 考 虑 物体 的 绘制 顺 
序 。 对 此 ， 我 们 应 遵循 以 下 规则 : 


首先 要 绘制 无 需 混 合 处 理 的 物体 。 接 下 来 ， 再 根据 混合 物体 与 摄像 
机 的 距离 对 它们 进行 排序 。 最 后 ， 按 由 远 及 近 的 顺序 通过 混合 的 方式 来 
绘制 这 些 物体 。 


依照 由 后 向 前 的 顺 友 进行 绘制 的 原因 是 ， 每 个 物体 都 会 与 其 后 的 所 
有 物体 执行 混合 运算 。 对 于 一 个 透明 的 物体 而 言 ， 我 们 应 当 可 以 透 过 它 
看 到 其 背后 的 场景 。 因 此 就 需要 将 透明 物体 后 的 所 有 对 应 像 系 部 预 完 写 





入 后 台 绥 冲 区 内 ， 随 后 再 将 此 透明 物体 的 源 像素 与 其 后 场景 的 目标 像素 
进行 混合 。 


而 对 于 10.5.1 节 中 所 述 的 泻 染 方法 而 言 ， 绘 制 顺序 便 是 无 关 紧 要 的 
了 ， 因 为 它 可 以 轻而易举 地 阻止 源 像 素 写 入 后 人 台 绥 冲 区 。 但 针对 10.5.2 
节 与 10.5.3 节 中 所 讨论 的 混合 方法 来 说 ， 我 们 照 理 就 要 先 绘制 非 混合 物 
体 ， 最 后 再 绘制 需要 混合 处 理 的 物体 。 这 是 由 于 我 们 希望 在 混合 运算 开 
台 之 前 ， 人 驳 将 所 有 的 非 混 合 几 何 体 都 置 于 后 台 绥 冲 区 中 。 然 而 ， 在 这 几 
种 混合 情况 里 其 实 并 不 需要 对 混合 物体 进行 排序 ， 因 为 这 几 种 混合 运算 
都 满足 交换 律 。 也 就 是 次， 如果 在 初始 时 后 台 缓冲 区 中 有 一 像素 为 颜色 
巨 ， 则 对 该 像素 连续 进行 2" 次 加 法 /减法 /乘法 单一 混合 运算 ， 便 无 须 考 碟 
此 间 的 计算 顺序 ， 即 : 











B= B40 0,.1 
B’ = 万 一 CI 一 CH 一.… 一 Cl 
B'=B® CO DC. 有 Ch 1 


10.5.5 “混合 与 深度 缓冲 区 


在 使 用 加 法 /减法 /乘法 运算 进行 混合 时 ， 会 涉及 深度 测试 《depth 
test) 这 一 问题 。 对 于 这 个 示例 ， 我 们 仅 用 加 法 混合 来 讲解 ， 但 其 中 的 
思路 也 同样 适用 于 减法 /乘法 的 混合 运算 。 如 果 要 用 加 法 混合 来 泻 染 
个 物体 集合 s， 并 和 希望 s 中 的 物体 不 会 互相 遮挡 ， 这 就 意味 着 我 们 只 需 将 
这 些 物体 的 颜色 数据 简单 地 累加 即 可 《〈 见 图 10.5) 。 为 此 ， 我 们 不 愿 在 
5 中 的 物体 之 间 进 行 深度 测试 。 大 开局 深 上 度 测 试 ， 却 并 没有 按 从 后 至 前 





的 顺序 进行 绘制 ， 那 么 ， 当 S$ 中 的 两 个 物体 存在 遮挡 关系 ， 经 过 深度 测 
试 后 ， 靠 后 的 像素 片段 便 会 被 丢弃 ， 这 意味 着 该 物体 的 像素 颜色 将 不 会 
被 累加 至 混合 求 和 的 结果 之 中 。 在 泻 染 s 中 的 物体 时 ， 我 们 可 以 通过 蔡 
止 向 深度 缓冲 区 的 写 操 作 来 共用 s 中 物体 之 间 的 深度 测试 。 由 于 深度 写 
入 操作 已 被 蔡 止 ，5 中 的 物体 在 进行 加 法 混合 时 ， 便 不 会 将 深度 信息 写 
入 深度 缓冲 区 ， 因 此 ，5s 中 的 物体 便 不 会 因 深 度 测 试 而 二 接替 盖 其 后 的 
物体 。 注意， 我 们 只 是 在 绘制 95〈 要 用 加 法 混合 的 方式 来 绘制 的 一 个 物 
体 集 合 ) 中 的 物体 时 共用 了 深度 值 写 入 操作 ， 但 深度 值 读 取 与 深度 检测 
仍然 是 开局 的 。 这 样 一 来 ， 非 混合 几何 体 〈 比 混合 几何 体 先 绘制 的 物 

体 ) 仍 将 遮挡 其 后 的 混合 几何 体 。 比 方 资 ， 如 果 我 们 有 一 个 需要 在 墙 后 
进行 加 法 混合 的 物体 集合 ， 那 么 这 些 混合 物体 最 后 是 看 不 到 的 ， 因 为 以 
非 混 合 方式 绘制 的 实心 不 透明 增 体 会 挡住 它们 。 至 于 如 何 蔡 用 深度 值 写 
入 操作 以 及 设置 深度 检测 ， 且 看 下 半分 解 。 





























图 10.5” 奉 采用 加 法 混合 ， 则 粒子 一 加 较 多 的 点 要 腕 于 周围 的 其 他 点 。 随 着 粒子 的 扩散 ， 原 来 
的 亮点 逐渐 变 暗 ， 而 散 至 其 他 点 处 的 粒子 又 与 当地 的 粒子 相 有 登 加 ， 使 那些 光 点 变 得 更 亮 





























10.6 alpha 通道 


根据 10.5.4 市 中 的 例子 可 以 看 出 ， 源 alpha 分 量 能 够 用 于 在 RGB 混 合 
的 过 程 中 控制 像素 的 透明 度 。 而 混合 方程 中 所 用 的 源 颜 色 实则 来 自 于 像 
素 着 色 器 。 正 如 在 第 9 章 中 所 见 ， 我 们 将 漫 反射 材质 的 alpha 值 作为 纹理 
着 色 器 的 alpha 输 出 。 这 样 一 来 ， 我 们 就 能 利用 漫 反射 图 (diffuse map ) 
中 的 alpha 通 道 来 控制 泥 合 过 程 中 的 透明 度 。 





float4 PS(VertexOut pin) : SV_Target 


float4 diffuseAlbedo = gDiffuseMap.Samplel( 
gsamAnisotropicWrap, pin.TexC) * gDiffuseAlbedo; 





// 从 漫 反 射 反照 率 获 取 alpha 值 的 常用 方法 
litColor.a = diffuseAlbedo.a; 
return litColor; 





an 以 在 常见 的 图 像 编 辑 软 件 〈( 例 如 Adobe Photoshop〉 中 添 
加 alpha 通 道 ， 接 着 再 将 图 像 保存 为 支持 alpha 通 道 的 格式 ， 如 DDS。 





10.7 ”裁剪 像素 


有 时 候 ， 我 们 希望 彻底 禁止 某 个 源 像素 参与 后 续 的 处 理 。 这 可 以 通 
过 HLSL 的 内 置 函数 clip(x) 来 实现 。 此 函数 仅 供 像素 着 色 器 调用 ， 若 x 
< 8， 则 当前 这 一 像素 将 从 后 面 的 处 理 阶 段 中 丢弃 。 用 这 个 函数 来 处 理 
铁丝 网 纹理 的 绘制 再 合适 不 过 了 ， 例 如 ， 就 如 图 10.6 所 示 的 效果 。 换 句 
话说 ， 用 它 来 绘制 透明 与 非 透明 相间 的 像素 再 好 不 过 了 。 
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图 10.6 ”具有 alpha 通 道 的 铁丝 网 纹理 。 有 着 黑色 alpha 值 的 像素 将 被 clip 函 数 丢 掉 ， 从 而 不 被 绘 
道 的 用 处 在 于 从 纹理 中 屏 


制 出 来 。 因 此 ， 只 有 铁丝 网 部 分 会 留存 下 来 。 从 本 质 上 来 讲 ，alpha 通 道 
蔽 掉 非 铁丝 网 的 部 分 





















































在 像素 着 色 器 中 ， 我 们 将 采集 像素 的 alpha 分 量 。 如 果 该 值 极 小 接近 
于 0， 则 表示 此 像素 是 完全 透明 的 ， 那 么 我 们 束 将 此 像素 从 后 续 处 理 中 


淘汰 挥 。 











float4 PS(VertexOut pin) : SV_Target 


float4 diffuseAlbedo = gDiffuseMap.Samplel( 
gsamAnisotropicWrap, pin.TexC) * gDiffuseAlbedo; 


#ifdef ALPHA_TEST 
// 在 alpha < 8.1 则 抛弃 该 像素 。 我 们 要 在 着 色 器 中 尽早 执行 此 项 测试 ， 以 尽快 检测 出 


满足 条 件 的 像素 














// 并 退出 着 色 器 ， 从 而 跳 过 后 续 的 相关 处 理 过 程 
clip(diffuseAlbedo.a - 0.1f); 
#endif 

















// 从 漫 反 射 反照 率 获 取 alpha 值 的 常用 手段 
litColor.a = diffuseAlbedo .ai 


return litColor; 


} 





可 以 观察 到 ， 只 有 在 定义 了 ALPHA_TEST 宏 的 时 候 才 会 实行 透明 像 
素 的 筛选 。 这 是 因为 我 们 有 时 可 能 并 不 希望 对 茶 些 泻 染 项 执行 cLip 方 
法 ， 所 以 要 有 能 力 针对 特殊 的 着 色 器 开启 或 关闭 对 此 函数 的 调用 。 而 且 
alpha 测 试 的 开销 也 不 小 ， 因 此 只 有 在 必要 的 情况 下 才 使 用 它 。 








注意 ， 通 过 混合 操作 也 能 实现 相同 的 效果 ， 但 是 使 用 clip 函 数 更 为 
有 效 。 首 先 ， 它 无 须 执行 混合 i ti 
理 期 间 也 不 必 考 虑 绘制 顺序 。 此 外 ， 通 过 提前 从 像素 着色 右 中 抛弃 像 
素 ， 能 够 使 之 略 过 像素 着 色 絮 bn 
些 后 续 指 令 是 坚 无 意义 的 ) 。 








注意 Note Ne 


纹理 过 小 操作 可 能 会 使 alpha 通 道 的 数据 略 受 影响 ， 因 此 在 裁 蚤 像素 
时 应 对 判断 值 留 出 适当 的 余地 〈 即 允许 特定 的 误差 )。 例 如 ， 可 以 根据 
接近 0 的 alpha 值 来 裁 甬 像 和 水， 但 不 要 按 精 确 的 0 值 进行 处 理 。 








图 10.7 所 示 的 是 “Blend Demo”( 混 合 ) 演示 程序 的 效果 。 它 用 透明 
混合 的 处 理 方 法 来 绘制 半 透 明 的 水 ， 并 通过 cl1ip 测 试 来 泻 染 铁丝 网 盒 
另 一 个 值得 一 提 的 变化 是 ， 由 于 当前 立方 体 使 用 的 是 铁丝 网 








图 10.7“Blend Demo” 演 示 程 序 的 效果 


纹理 ， 因 此 我 们 就 应 对 alpha 测 试 物体 都 禁用 背面 吻 除 (不然 后面 就 
穿帮 了 ! 


// 针对 alpha 测 试 物体 所 采用 的 PSO 
D3D12_ GRAPHICS PIPELINE STATE _ DESC alphaTestedPsoDesc = opaquePsoDesc; 
alphaTestedPsoDesc.PS = 
{ 
reinterpret cast<BYTE*>(mShaders["alphaTestedPS"]->GetBufferpointer()), 


mshaders["alphaTestedPS"]->GetBufferSize() 


}; 

alphaTestedPsoDesc.RasterizerState.CullMode = D3D12 CULL MODE_NONE; 

ThrowIfFailed(md3dDevice->CreateGraphicsPipelinestate( 
&alphaTestedPsoDesc, IID PPV_ARGS(&mPSOs["alphaTested"]))); 





10.8 ” 雾 


为 了 在 游戏 中 模拟 出 一 些 特定 的 天 气 状况 ， 我 们 往往 需要 实现 筋 化 
效果 ， 如 图 10.8 所 示 。 除 了 和 轩 效 本 映 这 个 主要 目的 之 外 ， 它 还 有 一 些 其 
他 的 用 处 。 例 如 ， 浓 筋 可 以 掩饰 远 处 景物 在 泻 染 上 的 失真 ， 以 及 防止 发 
生物 体 突然 出 现 (popping〉 叫 的 情况 。 突 然 出 现 是 指 一 个 物体 原本 位 于 
视 锥 体 远 平面 的 后 侧 ， 但 由 于 摄像 机 的 移动 ， 使 之 突然 出 现在 视 锥 体 的 
范围 之 内 ， 并 因此 令 它 变 得 可 见 ， 以 致 该 物体 看 起 来 似乎 是 突然 “ 瞬 
移 ” 到 了 场景 之 中 。 在 远 处 设立 一 层 筋 气 便 可 撼 善 物体 突然 出 现 的 现 
象 。 注 意 ， 如 条 场景 处 于 晴朗 的 白天 ， 不 妨 在 远 处 设 有 少量 的 薄 筋 。 因 
为 就 算是 万 里 无 云 的 好 天 气 ， 像 高 山 这 种 远 处 的 景物 依旧 云 筋 综 绕 ， 且 
务 气 将 随 着 深度 函数 值 的 增加 而 逐渐 变 浓 〈( 失 去 对 比 度 ，lose 
contrast) 。 此 时 ， 我 们 便 可 以 通过 和 雾 效 来 模拟 这 种 大 气 透视 的 现象 。 




















DD d3d App fps: 60000000 mspf: 16.556566 





图 10.8 ”开局 雾 效 的 “Blend Demo” 例 程 的 效果 





实现 雾 化 效果 的 流程 如 下 : 如 图 10.9 所 示 ， 首 先 指明 雾 的 颜色 、 由 


摄像 机 到 筋 气 的 最 近 距 离 以 及 筋 的 分 散 范 围 ( 即 从 筋 到 摄像 机 的 最 近 距 
履 关 物体 的 这 段 范围 ) ， 接 下 来 再 将 网 格 三 角形 上 点 的 颜 








离 至 雾 能 完 
色 置 为 原色 与 筋 色 的 加 权 平 均值 : 
foggedColor = litColor + stfogColor — litColor) 
一 (1 一 sjcdotlitColor + s: fogColor 
参数 s 的 范围 为 [0, 1]， 由 一 个 以 摄像 机 位 置 与 被 筋 惕 盖 物 体 表 面 点 


之 间 的 距离 作为 参数 的 函数 来 确定 。 随 着 该 表面 点 与 观察 点 之 间距 离 的 


增加 ， 它 会 被 雾气 遮挡 得 愈加 腹 鹏 。 参 数 s 的 定义 如 下 : 





dist(p.E)— fogStart 
s = Saturate - 
fogRiangrt 








其 中 ，dist(P, EE) 为 表面 点 P 与 摄像 机 位 置 E 之 间 的 距离 。 而 函 
数 saturate 会 将 其 参数 限制 在 区 间 [0, 1] 内 : 


| 


saturate( 工 ) = 0. 工 二 0 
1. TT>1 


x 


fogStart fogRange 








图 10.9 ”摄像 机 巨 到 某 点 的 距离 ，fogStart〈 摄 像 机 到 筋 气 的 最 近 距 离 ) 与 fogRange( 筋 气 的 
范围 ) 即 是 相关 参数 





图 10.10 所 示 为 根据 距离 函数 而 绘制 的 图 像 。 由 此 可 以 看 出 ， 当 


(p, 五 ) < fogStart 时 s = 0， 而 雾 的 颜色 则 由 下 式 给 出 : 
foggedColor = litColor 


换 句 话 说， 当 物 体 表面 点 到 摄像 机 的 距离 小 于 fogStart 时 ， 筋 色 就 
不 会 改变 物体 顶点 的 本 色 。 顾 名 思 义 ， 只 有 表面 点 到 摄像 机 的 距离 至 少 
为 "fogStart”〈 秀 效 开始 ) 时 ， 其 颜色 才 会 受到 筋 色 的 影 啊 。 


设 fogEnd = fogStart + fogRange。 当 dhst(P, E) > fogEnd 时 s = 1， 且 
筋 色 为 : 


foggedColor = fogColor 


这 便 是 说 ， 当 物体 表面 点 的 位 置 到 观察 点 的 距离 大 于 或 等 于 fogEnd 
时 ， 浓 筋 会 将 它 完 全 遮 住 一 一 所 以 我 们 只 能 看 到 筋 气 的 颜色 。 


从 图 10.10 中 不 难看 出 ， 当 fogStart < dist(p, E) < fogEnd 时 ， 随 着 
dist(p, 也) 从 fogStart 向 fogEnd 递 增 ， 变 量 s 也 呈 线 性 地 由 0 增加 至 1。 这 表 
明 随 着 距离 的 增加 ， 筋 色 会 越 来 越 浓 重 ， 而 物体 原色 也 愈加 窒 淡 。 这 是 
显而易见 的 ， 因 为 随 着 距离 的 增加 ， 筋 气势 必 越 发 浓重 ， 以 致 越 远 的 景 





下 列 着 色 器 代码 展示 了 如 何 来 实现 筋 效 。 我 们 先 计 算 距 离 ， 并 在 像 
素 层级 进行 插值 ， 最 后 再 求 出 光照 颜色 。 





L10= 下 
dist(p,E) 
fogStart [ogEnd 
1—s 
1.0 
dist(p,E) 
fogStart fogEnd 








图 10.10 上 图 中 ， 根 据 距 离 函 数 而 得 到 的 s〈( 筋 气 的 颜色 权 值 的 图 像 。 下 图 中 ， 根 据 距离 函 
数 而 得 到 的 1 一 5s (物体 的 颜色 权 值 ) 的 图 像 。 随 着 s 的 增加 ，(] 一 5) 势 必 将 相应 地 减少 














// 光源 数量 的 默认 值 
#ifndef NUM_DIR_LIGHTS 

#define NUM DIR LIGHTS 3 
#endif 





#ifndef NUM POINT_ LIGHTS 
#define NUM POINT LIGHTS 6 
#endif 


#ifndef NUM SPOT_LIGHTS 
#define NUM SPOT_LIGHTS 6 
#endif 





// 包含 光照 所 用 的 结构 体 与 沙 数 
#include "LightingUtil.hlsl" 





Texture2D gDiffuseMap : register(t0); 


SamplerState gsamPpointWrap : register(s6) ; 
SamplerState gsamPointClamp : register(s1) ; 
SamplerState gsamLinearWrap : register(s2); 


SamplerState gsamLinearClamp : register(s3); 
SamplerState gsamAnisotropicWrap : register(s4); 
SamplerState gsamAnisotropicClamp : register(s5); 














// 每 一 帧 中 都 在 变化 的 常量 数据 
cbuffer cbPerObject : register(b6) 
{ 

float4x4 gWorld; 

float4x4 gTexTransform; 


}; 


// 绘制 过 程 中 所 用 的 杂项 常量 数据 
cbuffer cbPass : register(b1) 
{ 

float4x4 gView; 

float4x4 gInvView; 

float4x4 gProj; 

float4x4 gInvProj; 

float4x4 gViewProj; 

float4x4 gInvViewProj; 

float3 8gEyePosW; 

float cbPerObjectPad1; 

float2 gRenderTargetSize; 

float2 gInvRenderTargetSize; 

float gNearz; 

float gFarz; 

float gTotalTime; 

float gDeltaTime; 

float4 gAmbientLight; 




















// 允许 应 用 程序 在 每 一 帧 都 能 改变 雾 效 参数 

// 例如 ， 我 们 可 能 只 在 一 天 中 的 特定 时 间 才 使 用 雾 效 
float4 gFogColor 

float gFogStart; 

float gFogRange; 

float2 cbPerPassPad2; 














// 对 于 每 个 以 MaxLights 为 光源 数量 最 大 值 的 对 象 而 言 ， 索 引 [8@,NUM_DIR_LIGHTS ) 表 


// 源 ， 索 引 [NUM_DIR_LIGHTS，NUM_DIR_LIGHTS+NUM_POINT_LIGHTS) 表 示 的 是 点 光源 





示 的 是 方向 光 











// 索引 [NUM_DIR_LIGHTS+NUM_POINT_LIGHTS，NUM_DIR_LIGHTS+NUM_POINT_LIGHT+ 


NUM_SPOT_ 
// LIGHTS) 表 示 的 是 聚光灯 光源 


Light gLights[MaxLights]; 
}; 


// 每 种 材质 中 的 不 同 常量 数据 

cbuffer cbMaterial : register(b2) 
{ 

float4 gDiffuseAlbedo; 

float3 gFresnelRe; 

float gRoughness; 

float4x4 gMatTransform; 


}; 





struct VertexIn 

{ 
float3 PosL : POSITION; 
float3 NormalL : NORMAL; 
float2 TexC : TEXCOORD; 


}; 


struct VertexOut 

{ 
float4 PosH : SV_POSITION; 
float3 PosW : POSITION; 
float3 NormalW : NORMAL; 
float2 TexC : TEXCOORD; 


}; 


VertexOut VS(VertexIn vin) 


{ 
VertexOut vout = (VertexOut)0.ef; 














// 把 顶点 变换 到 世界 空间 
float4 posW = mul(float4(vin.PosL, 1.6f), gWorld); 
Vvout .PosN = posW.xyz; 








// 假设 要 进行 的 是 等 比 缩放 ， 人 否则 便 应 使 用 世界 和 矩阵 的 逆转 置 矩 阵 
vout .NormalN = mul(vin.NormalL, (float3x3)gWorld); 
































// 将 顶点 变换 到 齐 次 裁剪 空间 
vout .PosH = mul(posNW，gViewProj); 








// 为 三 角形 插值 而 输出 顶点 属性 
float4 texC = mul(float4(vin.TexC，6.6f，1.6f)，gTexTransform) ; 
vout .TexC = mul(texC, gMatTransform).xy; 


























return vout; 


} 


float4 PS(VertexOut pin) : SV_Target 
{ 


float4 diffuseAlbedo = gDiffuseMap.Sample( 
gsamAnisotropicWrap, pin.TexC) * gDiffuseAlbedo; 


#ifdef ALPHA_TEST 

// 如 果 纹 理 的 alpha < 8.1 则 丢弃 该 像素 。 我 们 应 尽早 执行 这 项 测试 ， 以 便 尽 快 检测 到 满 
足 条 件 的 像素 

// 并 提前 退出 着 色 器 ， 从 而 跳 过 着 色 器 的 后 续 处 理 

clip(diffuseAlbedo.a - 6.1f); 
#endif 













































































// 对 法 线 插值 可 能 导致 其 非 规 范 化 ， 因 而 要 重新 对 它 进行 规范 化 处 理 


pin.NormalN = normalize(pin.NormalW); 























山 | 


// 光线 经 表面 上 一 点 反射 到 观察 点 这 一 方向 上 的 向 量 
float3 toEyeW = gEyePosW - pin.PosW; 

float distToEye = length(toEyeW) ; 

toEyeW /= distToEye; // 规范 化 处 理 
































// 光照 项 
float4 ambient = gAmbientLight*diffuseAlbedo; 


const float shininess = 1.6f - gRoughness ; 

Material mat = { diffuseAlbedo，8gFresnelR6，shininess }; 

float3 shadowFactor = 1.6f; 

float4 directLight = ComputeLighting(gLights, mat, pin.PosW, 
pin.NormalW, toEyeW, shadowFactor); 


float4 litColor = ambient + directLight; 

#ifdef FOG 
float fogAmount = saturate((distToEye - gFogStart) / gFogRange); 
litColor = lerp(litColor, gFogColor, fogAmount); 

#endif 











// 从 漫 反 射 反照 率 中 获取 alpha 值 的 常用 手法 
litColor.a = diffuseAlbedo.a; 


return litColor; 


} 





有 一 些 场 景 可 能 并 不 会 用 到 筋 效 ， 因 此 我 们 将 该 功能 设 为 可 选项 ， 
若 要 使 用 ， 则 需 在 编译 着 色 器 时 定义 F0G 宏 。 这 样 一 来 ， 如 果 不 希 望 使 
用 筋 效 ， 则 不 必 为 相关 运算 而 付出 开销 代价 。 在 演示 程序 中 ， 我 们 通过 
向 Compileshader 函 数 提供 下 列 D3D_SHADER_MACRO 结 构 体 来 开启 雾 








const D3D_SHADER_MACRO defines[] = 
{ 


"FOG", “1, 
NULL, NULL 


}; 


mShaders["opaquePS"] = d3dUtil::CompileShader( 
L"Shaders\\Default.hlsl", defines, "PS", "ps 5 6"); 





通过 观察 可 以 发 现 ， 我 们 不 仅 在 雾 效 运 算 中 使 用 了 distToEye， 而 
且 在 对 法 线 进 行规 范 化 处 理 时 也 用 到 了 此 值 。 这 里 再 给 出 一 个 优化 方面 
稍 差 的 实现 ， 试 对 比 : 





float3 toEyeW = normalize(gEyePosW - pin.PoshW); 


float distToEye = distance(gEyePosW, pin.PoshW); 





这 段 代 码 其 实 将 向 量 toEyeW 的 长 度 计 算 了 两 次 : 一 次 是 
用 normalize 函 数 ， 另 一 次 是 用 distance 函 数 。 


10.9 小结 


1. 混合 是 一 种 将 当前 符 光 栅 化 的 像 率 《〈 即 源 像 素 ) 与 之 前 已 光栅 
化 并 存 至 后 合 缓冲 区 的 像素 〈 即 目标 像素 ) 相 融 合 ( 组 合 ) 的 技术 。 它 
使 我 们 可 以 渲染 出 半 透 明 效 果 的 物体 ， 如 水 与 玻璃 。 


2. 混合 方程 形 如 : 


C = Csrc oO 了 srcEHHC dst < Fst 


A = Agsrc FsrcEpAdst Pdst 








注意 到 ，RGB 分 量 与 alpha 分 量 的 混合 运算 实际 上 是 各 自 单独 展开 
的 。 二 元 运算 符 田 是 枚 举 类 型 D3D12_BLEND_OP 的 成 员 之 一 。 








3. 了 sc、Fast、fsre 与 Fast 都 被 称 为 混合 因子 ， 它 们 是 混合 方程 可 自 
定义 的 法 宇 。 这 些 因 子 是 枚 举 类 型 D3D12_BLEND 中 的 成 员 之 一 。 男 外 ， 
对 于 alpha 混 合 方程 来 说 ， 不 能 采用 以 _COLOR 作 为 后 绥 的 混合 因子 。 





4. 源 alpha 的 信息 来 自 于 漫 反 财 材 质 。 在 我 们 日 己 编写 的 应 用 框架 








5. 通过 HLSL 的 内 部 函数 clip(x) 可 以 将 源 像素 从 后 续 的 处 理 过 程 
中 完全 屏蔽 掉 。 此 函数 仅 可 在 像素 着 色 器 中 调用 ， 当 x < 8 时 它 便 丢弃 
当前 的 像素 。 此 外 ， 该 函数 对 不 透明 与 透明 相间 像素 的 绘制 也 是 极为 有 
效 的 《 即 此 函数 可 用 于 过 小 完全 透明 的 像 系 ， 也 就 是 alpha 值 接近 于 0 的 


像素 ) 。 


6. 可 以 使 用 稚 效 来 模拟 各 种 气象 环境 效果 和 大 气 透视 现象 ， 以 此 
来 掩饰 远 处 场景 演 染 的 失真 以 及 物体 突然 出 现 于 视 锥 体 之 中 间 进 用 户 视 
野 内 的 情况 。 在 我 们 所 用 的 线性 筋 效 模型 中 ， 需 要 指定 务 气 的 闫 色 ， 从 
摄像 机 至 盈 效 的 最 近 距 离 以 及 务 的 出 现 范围 。 此 时 ， 网 格 三 角形 上 某 点 
的 颜色 是 其 原色 与 雾 色 的 加 权 平 均值 : 





foggedColor = litColor + stfogColor — litColor) 
= (1— ss):litColor + s: fogColor 
参数 的 取 值 范围 是 [0, 1]， 由 一 个 以 摄像 机 位 置 与 物体 表面 点 之 间 
距离 为 参数 的 函数 来 表示 。 随 独 表 面 点 与 观察 点 之 间距 离 的 增加 ， 表 面 
扩 受 务 气 的 影响 将 变 得 看 起 来 越 来 越 滕 肝 。 











10.10 “练习 








1. 体会 不 同 的 混合 运算 与 不 同 混合 因子 的 组 合 效果 。 


2. 修改 “Blend Demo” 演 示 程 序 ， 首 先 绘制 水 流 。 请 解释 这 一 改变 
所 产生 的 效果 。 


3. 设 fogStart = 10 且 fogRange = 200。 针 对 下 列 各 种 情况 来 计算 
foggedColor。 


(a) dist(p, E)= 160 
(b) dist(p, E) = 110 
(c) dist(p, E)= 60 
(d) dist(p, E) = 30 


通过 查看 生成 的 着 色 器 汇编 代码 来 验证 : 当 没 有 定 
义 ALPHA_TEST 宏 时 ， 编 译 后 的 像素 着 色 堪 不 会 用 到 discard 指 令 ， 反 
之 则 会 用 到 。 此 discard 指 令 对 应 于 HLSL 中 的 clip 指 令 





5. 修改 “Blend Demo” 演 示 程 序 ， 创 建 并 应 用 禁止 向 红色 通道 和 绿 
色 通 道 写 入 颜色 信息 的 混合 泻 染 状 态 。 














[1] 这 个 词 也 常用 于 表示 不 同 LOD (level of detail， 细 节 层 级 ) 模型 突 





匹 的 切换 所 造成 的 视觉 上 的 跳跃 ， 此 时 常 译作 “ 突 跃 ”"。 这 与 当前 文中 的 
popping 是 两 种 概念 。 


第 11 章 ”模板 


模板 缓冲 区 (stencil buffer) 是 一 种 “ 离 屏 ”(off-screen) 绥 冲 区 ， 
我 们 可 以 利用 它 来 实现 一 些 特殊 效果 。 模 板 缓冲 区 、 后 台 绥 冲 区 以 及 深 
度 缓冲 区 都 有 首相 同 的 分 辨 卒 ， 这 样 一 来 ， 这 三 者 相同 位 置 上 的 像素 就 
能 一 一 对 应 起 来 。 回 顾 4.1.5 节 可 知 ， 在 指定 一 个 模板 缓冲 区 时 ， 要 将 它 
与 一 个 深度 缓冲 区 配合 使 用 。 顾 名 思 义 ， 这 种 缓冲 区 所 起 到 的 作用 就 如 
同 印刷 过 程 中 所 用 的 模板 一 样 ， 我 们 可 以 用 它 来 阻止 特定 的 像素 片段 泻 
染 至 后 台 缓 冲 区 中 。 








举 个 例子 ， 当 泻 染 一 面 镜子 时 ， 我 们 需要 将 物体 反映 到 镜子 所 在 的 
平面 上 。 当 然 ， 只 应 绘制 出 镜子 中 的 镜像 部 分 。 这 时 ， 我 们 就 能 通过 模 
板 缓冲 区 来 阻止 镜子 范围 以 外 镜像 部 分 的 绘制 操作 〈 见 图 11.1) 。 





图 11.1 《〈 左 图 ) 在 镜子 中 正确 地 反射 出 了 船 髓 头 的 映像 。 由 于 深度 测试 的 原因 ， 使 得 砖 块 后 的 
人 骼 能 头 部 分 没有 显现 出 来 。 但 是 ， 我 们 仍然 能 够 从 左 侧 看 到 墙 面 后 露出 的 嵩 通 头 镜像 ， 显 然 ， 

这 是 违反 3D 视 觉 原 理 的 《镜像 只 能 在 镜 中 呈现 ) 。( 右 图 ) 借助 模板 缓冲 区 ， 我 们 便 能 阻止 镜 
面 外 映像 的 绘 于 
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要 设置 模板 缓冲 区 〔 以 及 深度 缓冲 区 ) 状态 ， 就 需 填 写 
D3D12_DEPTH_STENCIL_DESC 结 构 体 实例 ， 并 将 其 赋予 流水 线 状态 对 象 
(PSO) 的 
D3D12_ GRAPHICS PIPELINE STATE DESC: :Depthstencilstate 字 
段 。 学 习 模 板 缓冲 区 用 法 的 最 佳 方式 即 从 现存 的 示例 应 用 程序 着 手 。 一 
旦 对 实例 中 的 模板 缓冲 区 部 分 有 了 感性 的 认识 ， 我 们 便 可 以 更 加 得 心 应 
手 地 运用 它 了 。 





学 习 目 标 : 


1. 探究 如 何 通 过 填写 流水 线 状 态 对 象 中 的 
D3D12_DEPTH_STENCIL_DESCDepthSstencilSstate 字 段 来 控制 深度 组 
冲 区 以 及 模板 绥 冲 区 。 


2. 学 习 通 过 模板 缓冲 区 来 防止 镜像 被 绘 至 镜子 以 外 的 区 域 ， 以 此 
来 实现 正确 的 镜像 效果 。 


3. 了 解 双重 混合 (double blending〉 的 机 制 ， 从 而 利用 模板 缓冲 区 
来 有 效 地 杜绝 这 一 情况 的 发 生 。 


4. 知晓 深度 复杂 性 (depth complexity) 的 概念 ， 并 介绍 两 种 方法 


来 度量 场景 的 深度 复杂 性 。 








11.1 深度 /模板 缓冲 区 的 格式 及 其 资源 数据 的 清 
理 


回顾 前 文 的 内 容 便 会 想起 ， 深 度 / 模 板 缓 冲 区 其 实 也 是 一 种 纹理 ， 
因而 必须 用 下 列 特定 的 数据 格式 来 创建 它 。 深 上 度 /模板 缓冲 可 用 的 格式 
如 下 : 


1. DXGI_FORMAT_D32_FLOAT_S8X24_UINT: 此 格式 用 一 个 32 位 浮 
点 数 来 指定 深度 缓冲 区 ， 并 以 男 一 个 32 位 无 符号 整数 来 指定 模板 缓冲 
区 。 其 中 ， 无 符号 整数 里 的 8 位 用 于 将 模板 绥 冲 区 映射 到 范围 [0, 255]， 
另外 24 位 不 可 用 ， 仅 作 填 充 占 位 。 




















2. DXGI_FORMAT_D24_UNORM_S8_UINT: 指定 一 个 无 符号 的 24 位 
深度 缓冲 区 ， 并 将 其 映射 到 范围 [0, 1] 内 。 男 外 8 位 (无 符号 整数 ) 用 于 
令 模 板 缓冲 区 映射 至 范围 [0, 255]。 


在 D3DApp 应 用 框架 中 ， 当 要 创建 深度 缓冲 区 时 束 要 像 下 面 那样 来 
指定 它 的 格式 : 


DXGI_FORMAT mDepthstencilFormat = DXGI_ FORMAT D24 UNORM S8_UINT; 





depthStencilDesc.Format = mDepthSstencilFormat; 





我 们 可 以 在 绘制 每 一 帧 画面 之 初 ， 用 以 下 方法 来 重 置 模板 缓冲 区 中 
的 局 部 数据 《也 可 用 于 清理 深度 缓冲 区 ) 。 





void ID3D12GraphicsCommandList: :ClearDepthStencilView( 
D3D12_CPU_DESCRIPTOR_HANDLE DepthStencilView, 


D3D12_CLEAR_FLAGS ClearFlags, 
FLOAT Depth ， 

UINT8 Stencil, 

UINT NumRects， 

const D3D12 RECT *pRects); 





1. DepthstencilView: 待 清理 的 深度 /模板 绥 冲 区 视图 的 描述 


2. ClearFlags: 指定 为 D3D12_ CLEAR_FLAG_DEPTH 仅 清理 深度 组 
冲 区 ， 指 定 为 D3D12_ CLEAR_FLAG_STENCIL 只 清理 模板 缓冲 区 ， 指 定 
为 D3D12_CLEAR FLAG DEPTH | D3D12_CLEAR_FLAG_STENCIL 则 同时 
清理 这 两 种 缓冲 区 。 





3.Depth: 将 此 浮 点 值 设 置 到 深度 缓冲 区 中 的 每 一 个 像素 。 此 浮 
点 数 I 务 必 满 足 0 所 二 1。 


4. Stencil: 将 此 整数 值 设置 到 模板 缓冲 区 中 的 每 一 个 像素 。 此 
整数 nn 必须 满足 0 < n < 255。 





5. NumRects: 数组 pRects 中 所 指引 的 矩形 数量 。 


6. pRects: 一 个 D3D12_RECT 类 型 数组 ， 它 标定 了 一 系列 深度 / 模 
板 缓冲 区 内 要 清理 的 区 域 。 若 指定 为 nu11ptr 则 清理 整个 深度 /模板 缓冲 
区 。 





我 们 在 演示 程序 中 的 每 一 帧 都 已 经 调用 此 方法 ， 形 如 : 





mCommandList->ClearDepthStencilView(DepthStencilView(), 
D3D12 CLEAR FLAG DEPTH | D3D12 CLEAR FLAG STENCIL, 


1.6f, 0, 060, nullptr); 


11.2 模板 测试 


如 前 所 述 ， 我 们 可 以 通过 模板 缓冲 区 来 阻止 对 后 台 绥 冲 区 特定 区 域 
的 绘制 行为 。 而 这 项 操作 实则 是 由 模板 测试 (stencil test) 来 决定 的 ， 
它 的 处 理 过 程 如 下 : 


if( StencilRef & StencilReadMask 3 Value & StencilReadMask ) 


accept pixel 
else 
reject pixel 





模板 测试 会 随 着 像 系 的 光栅 化 过 程 而 执行 〈 即 在 输出 合并 阶段 进 
行 ) 。 大 模板 功能 呈 开 局 状态 ， 则 需 经 过 下 面 两 处 运算 。 





左 运 算数 〈left-hand-side，LHS) 由 程序 中 定义 的 模板 参考 值 
(stencil reference value) StencilRef 与 程序 内 定义 的 掩 码 值 (masking 
value) StencilReadMask 通 过 AND〈 与 ) 运算 来 加 以 确定 。 


2. 右 运 算数 (right-hand-side，RHS) 由 正在 接受 模板 测试 的 特定 
像素 位 于 模板 缓冲 区 中 的 对 应 值 Value 与 程序 中 定义 的 掩 码 
值 StencilReadMask 经 过 AND 计 算 来 加 以 确定 。 








可 以 发 现 ， 左 运算 数 与 右 运 算数 中 的 StencilReadMask 是 同一 个 
值 。 接 下 来 ， 模 板 测 试用 程序 中 所 选 定 的 比较 函数 〈comparison 
function) 马 对 左 运算 数 与 右 运 算数 进行 比 对 ， 从 而 得 到 布尔 类 型 的 返回 
值 。 如 果 测 试 结果 为 tue， 束 将 当前 受 检测 的 像素 写 入 后 台 缓 冲 区 〔 即 








假设 此 像素 已 通过 深度 测试 》; 如 果 测 试 结果 为 false， 则 禁止 此 像素 问 
后 台 绥 冲 区 的 写 操 作 。 当 然 ， 如 果 一 个 像素 因 模 板 测 试 失败 而 被 丢弃 ， 
它 的 相关 数据 也 不 会 被 写 入 深度 缓冲 区 。 


运算 符 “4” 是 D3D12_COMPARISON_FUNC 枚 举 类 型 所 定义 的 比较 函 
数 之 一 器 : 


typedef 
{ 


enum D3D12_ COMPARISON_FUNC 


D3D12 COMPARISON_FUNC_ NEVER = 1, 
D3D12_ COMPARISON_FUNC_LESS = 2， 
D3D12_ COMPARISON_FUNC_EQUAL = 3， 
D3D12_ COMPARISON_FUNC_LESS_ EQUAL = 4， 
D3D12 COMPARISON_FUNC_GREATER = 5， 
D3D12_ COMPARISON_FUNC_NOT_EQUAL = 6， 
D3D12_ COMPARISON_FUNC_GREATER_EQUAL 
D3D12_ COMPARISON_FUNC_ALWAYS = 8， 

} D3D12 COMPARISON_FUNC; 


1. 





D3D12_COMPARISON_FUNC_NEVER: 该 函数 总 是 返回 false。 


.D3D12_COMPARISON_FUNC_LESS: 用 运算 符 < 蔡 换 4。 


.D3D12_COMPARISON_FUNC_EQUAL: 用 运算 符 == 蔡 换 3。 


D3D12_COMPARISON_FUNC_LESS_EQUAL: 用 运算 符 冬 替换 3。 


. D3D12_COMPARISON_FUNC_GREATER: 用 运算 符 > 替换 3。 
. D3D12_COMPARISON_FUNC_NOT_EQUAL: 用 运算 符 != 蔡 换 4。 


.D3D12_COMPARISON_FUNC_GREATER_EQUAL: 用 运算 符 > 蔡 换 3 


8. D3D12_COMPARISON_FUNC_ALWAYS: 此 函数 总 是 返回 true。 


11.3” 摘 述 深度 /模板 状态 


要 描述 深度 /模板 状态 ， 就 需 填 写 D3D12_DEPTH_STENCIL_DESC 实 
例 : 


typedef struct D3D12 DEPTH STENCIL DESC { 
BOOL DepthEnable; // 默认 值 为 True 





// 默认 值 为 D3D12_DEPTH_WNRITE_MASK_ALL 
D3D12_DEPTH WRITE MASK DepthWwriteMask; 


// 默认 值 为 D3D12_COMPARISON_LESS 
D3D12 COMPARISON FUNC DepthFunc ; 





BOOL StencilEnable; // 默认 值 为 False 

UINT8 StencilReadMask; // 默认 值 为 @xff， 即 D3D12_DEFAULT_STENCIL_WRIT 
E_MASK 

UINT8 StencilWriteMask; 默认 值 为 @xff， 即 D3D12_DEFAULT_STENCIL _WRIT 
E_MASK 

D3D12_DEPTH_STENCILOP_DESC FrontFace; 

D3D12_DEPTH_STENCILOP_DESC BackFace; 
} D3D12_DEPTH_STENCIL DESC; 














11.3.1 深度 信息 的 相关 设置 


深度 信息 的 相关 设置 如 下 。 


1. DepthEnable: 设置 为 tue， 则 开启 深度 缓冲 ; 设置 为 false， 则 
茶 用 。 当 深度 测试 被 荣 止 时 ， 物 体 的 绘制 顺序 融 变 得 极为 重要 ， 人 否则 位 
于 遮挡 物 之 后 的 像素 片段 也 将 被 绘制 出 来 〈 回 顾 4.1.5 节 ) 。 如 采 深 度 绥 
冲 被 禁用 ， 则 深度 缓冲 区 中 的 元 素 便 不 会 补 更 新 ，DepthwriteMask 项 
的 设置 也 不 会 起 作用 。 





2. DepthWriteMask: 可 将 此 参数 设置 
为 D3D12_DEPTH_WRITE_MASK_ZERO 或 
者 D3D12_DEPTH_WRITE_MASK_ALL， 但 两 者 不 能 共存 。 假 设 
DepthEnab1le 为 true， 知 把 此 参数 设置 
为 D3D12_DEPTH_WRITE_MASK_ZERO 便 会 禁止 对 深度 缓冲 区 的 写 操作 ， 
但 仍 可 执行 深度 测试 ， 知 将 该 项 设 
为 D3D12_DEPTH_WRITE_MASK_ALL， 则 通过 深度 测试 与 模板 测试 的 深 
度数 据 将 被 写 入 深度 缓冲 区 。 这 种 控制 深度 数据 读 写 的 能 力 ， 为 某 些 特 
效 的 实现 提供 了 民 好 的 契机 。 





3. DepthFunc: 将 该 参数 指定 为 枚 举 类 型 
D3D12_COMPARISON_FUNC 的 成 员 之 一 ， 以 此 来 定义 深度 测试 所 用 的 比 
较 函 数 。 此 项 一 般 被 设 为 D3D12_COMPARISON_FUNC_LESS， 因 而 常 
执行 如 4.1.5 节 中 所 述 的 深度 测试 。 即 ， 知 给 定 像素 户 段 的 深度 值 小 于 位 
于 深度 缓冲 区 中 对 应 像素 的 深度 值 ， 则 接受 该 像素 片段 〈 离 摄像 机 近 的 
物体 遮挡 距 摄像 机 远 的 物体 ) 。 当 然 ， 也 正如 我 们 所 看 到 的 ，Direct3D 
也 人 允许 用 户 根 据 需求 来 自 定 义 深 度 测 试 。 














11.3.2 ”模板 信息 的 相关 设置 


模板 信息 的 相关 设置 如 下 。 


1. StencilEnable: 设置 为 tue， 则 开启 模板 测试 ， 设 置 为 false， 
则 禁用 。 


2. StencilReadMask: 该 项 用 于 以 下 模板 测试 : 


if( StencilRef & StencilReadMask 3 Value & StencilReadMask ) 


accept pixel 
else 
reject pixel 





若 采 用 该 项 的 默认 值 ， 则 不 会 屏蔽 任何 一 位 模板 值 。 
#define D3D12 DEFAULT_STENCIL READ MASK ( 6xff ) 


3. StencilwriteMask: 当 模 板 绥 冲 区 被 更 新 时 ， 我 们 可 以 通过 
写 掩 码 (write mask) 来 屏 菩 特定 位 的 写 入 操作 。 例 如 ， 如 果 我 们 希望 
防止 前 4 位 数据 被 改写 ， 便 可 以 将 写 掩 码 设置 为 0x0f。 而 默认 配置 是 不 
会 屏蔽 任何 一 位 模板 值 的 : 





#define D3D12 DEFAULT_STENCIL WRITE MASK ( Q@xff ) 


4. FrontFace: 填写 一 个 D3D12_DEPTH_STENCILOP_DESC 结 构 体 
实例 ， 以 指示 根据 模板 测试 与 深度 测试 的 结 末 ， 应 对 正面 朝 同 的 三 角形 
要 进行 何 种 模板 运算 。 


5. BackFace: 填写 一 个 D3D12_DEPTH_STENCILOP_DESC 结 构 体 实 
例 ， 以 指出 根据 模板 测试 与 深度 测试 的 结果 ， 应 对 背面 朝 回 的 三 角形 要 
进行 何 种 模板 运算 。 





typedef struct D3D12 DEPTH STENCILOP DESC { 





D3D12_STENCIL _OP StencilFailop; // 默认 值 为 : D3D12_STENCIL _OP_KEEP 
D3D12_STENCIL_OP StencilDepthFail0op; // 默认 值 为 : D3D12_STENCIL_OP_KEEP 
D3D12_STENCIL_OP StencilpassOp; // 默认 值 为 : D3D12_STENCIL_OP_KEEP 
D3D12_COMPARISON_FUNC StencilFunc;  // 默认 值 为 : D3D12_COMPARISON_FUNC_AL 


WAYS 
} D3D12_DEPTH_STENCILOP_DESC; 


1. StencilFail0p: 枚 举 类 型 D3D12_STENCIL_0OP 中 的 成 员 之 
一 ， 摘 述 了 当 像 素 户 段 在 模板 测试 失败 时 ， 应 该 怎样 更 新 模板 缓冲 区 。 


2. StencilDepthFail0p: 枚 举 类 型 D3D12_STENCIL_OP 中 的 成 员 
之 一 ， 描 述 了 当 像 素 片 段 通过 模板 测试 ， 却 在 深度 测试 失败 时 ， 应 如 何 
更 新 模板 缓冲 区 。 


3. StencilpPass0p: 枚 举 类 型 D3D12_STENCIL_0P 中 的 成 员 之 
一 ， 描 述 了 当 像 素 片 段 通过 模板 测试 与 深度 测试 时 ， 该 怎样 更 新 模板 组 
冲 区 。 


4. StencilFunc: 枚 举 类 型 D3D12_COMPARISON_FUNC 中 的 成 员 之 
一 ， 定 义 了 模板 测试 所 用 的 比较 函数 。 


typedef 

enum D3D12_STENCIL_OP 

{ 
D3D12_STENCIL OP_KEEP 
D3D12_STENCIL OP_ZERO 
D3D12 STENCIL OP_ REPLACE 


- 


下 


.> 


D3D12_STENCIL OP_INCR_SAT 
D3D12_STENCIL OP_DECR_SAT 
D3D12_STENCIL OP_INVERT 
D3D12_STENCIL OP_INCR 
D3D12_STENCIL OP_DECR 

} D3D12_STENCIL _OP; 


-> -> 


-> 


cov 上 wwP 情 





1. D3D12_STENCIL_OP_KEEP: 不 修改 模板 缓冲 区 ， 即 保持 当前 的 
数据 。 


2. D3D12_STENCIL_OP_ZERO: 将 模板 缓冲 区 中 的 元 素 设 置 为 0。 





3. D3D12_STENCIL_OP_REPLACE: 将 模板 缓冲 区 中 的 元 素 蔡 换 为 
用 于 模板 测试 的 模板 参考 值 (StencilRef) 。 注 意 ， 只 有 当 我 们 将 深 
度 /模板 缓冲 区 状态 块 绑 定 到 泻 染 流 水 线 时 ， 才 能 够 设 定 SstencilRef 值 
(MILS.3R) 





4. D3D12_STENCIL _OP_INCR_SAT: 对 模板 缓冲 区 中 的 元 素 进行 
递增 (increment) 操作 。 如 果 递 增值 超出 最 大 值 〈 例 如 ，8 位 模板 缓冲 
区 的 最 大 值 为 255) ， 则 将 此 模板 绥 冲 区 元 素 限 定 为 最 大 值 。 








5. D3D12_STENCIL _OP_DECR_SAT: 对 模板 缓冲 区 中 的 元 素 进 行 
递减 〈decrement) 操作 。 如 果 北 减 值 小 于 0， 则 将 该 模板 缓冲 区 元 素 限 
定 为 0。 

6. D3D12_STENCIL_OP_INVERT: 对 模板 缓冲 区 中 的 元 素数 据 按 二 
进 制 位 进行 反 转 。 


7. D3D12_STENCIL_OP_INCR: 对 模板 绥 冲 区 中 的 元 素 进 行 递 增 操 
作 。 如 果 递 增值 超出 最 大 值 〈 例 如 ， 对 于 8 位 模板 缓冲 区 而 言 ， 其 最 大 
值 为 255) ， 则 环 回 至 0。 





8. D3D12_STENCIL_OP_DECR: 对 模板 缓冲 区 中 的 元 素 进 行 递 减 操 
作 。 如 果 递 减 值 小 于 0， 则 环 回 至 可 取 到 的 最 大 值 。 











模板 运算 可 以 是 互 不 相同 的 。 由 于 在 执行 背面 吻 除 后 背面 朝 同 的 多 边 形 
并 不 会 得 到 泻 染 ， 所 以 在 这 种 情况 下 对 BackFace 的 设置 便 是 无 足 轻重 
的 。 然 而 ， 我 们 有 时 候 却 需要 针对 特定 的 图 形 学 算法 或 透明 几何 体 〈 例 
如 铁丝 网 盒 ， 我 们 能 透 过 它 看 到 其 背后 的 面 ) 的 处 理 来 泻 染 背 面 朝向 的 
多 边 形 。 而 此 时 对 BackFace 的 设置 则 又 变 得 特别 重要 。 








11.3.3 ”创建 和 绑 定 深度 /模板 状态 


一 旦 将 描述 深度 /模板 状态 的 D3D12_DEPTH_STENCIL_DESC 实 例 填 
写 完整 ， 我 们 就 可 以 将 其 赋予 PSO 的 
D3D12_GRAPHICS_ PIPELINE STATE_DESC::Depthstencilstate 字 
段 。 而 使 用 此 PSO 绘 制 的 几何 体 ， 都 将 根据 上 述 的 深度 /模板 设置 来 进行 


演 染 。 


区 


有 一 个 细节 我 们 还 未 兽 提 及 ， 即 如 何 来 设置 模板 参考 值 。 此 操作 可 
由 ID3D12GraphicsCommandList:: OMSetStencilRef 方 法 来 实现 ， 
它 以 一 个 无 符号 整数 作为 参数 。 例 如 ， 下 列 代码 将 模板 参考 值 设置 为 
1: 


mCommandList->OMSetStencilRef(1); 


11.4 实现 平面 镜 效 果 


在 现实 生活 中 ， 许 多 物体 的 表面 篆 能 看 作 镜面 ， 我 们 可 以 从 中 看 到 
物体 的 镜像 。 本 节 将 描述 如 何在 3D 应 用 程序 中 模拟 镜面 效果 。 注 意 ， 
为 了 方便 起 见 ， 此 处 将 实现 镜面 的 任务 简化 为 仅 完成 平面 镜 效 果 。 比 如 
说， 一 辆 锤 光 瓦 之 的 小 轿车 会 反映 出 周围 环境 的 镜像 ， 但 车 体 光 消 、 具 
有 弧 线 ， 却 非 平面 。 我 们 要 泻 染 的 镜像 类 似 于 光滑 的 大 理 石 地 板 或 巧 挂 
在 增 上 的 镜子 所 反映 出 的 镜像 一 一 换 句 话 说 ， 我 们 要 模拟 的 是 位 于 平面 
上 的 镜面 。 





在 实现 镜像 编程 的 过 程 中 蝶 需 解决 两 个 问题 。 痛 先 ， 我 们 必须 了 解 
任意 平面 反射 物体 的 相关 原理 ， 以 此 来 正确 地 绘制 镜像 。 其 次 ， 我 们 一 
定 要 将 镜像 显示 在 镜子 当中 ， 即 必须 以 东 种 方式 “标记 ”出 表面 内 的 镜面 
部 分 。 而 后 ， 随 着 演 染 工 作 的 开展 ， 只 有 处 于 镜面 内 的 物体 映像 部 分 才 
会 被 绘制 出 来 。 对 此 可 以 回顾 图 11.1， 那 是 我 们 第 一 次 提 及 这 个 概念 的 
地 方 。 








第 一 个 问题 通过 一 些 解析 几何 学 的 知识 便 可 以 轻松 地 解决 ， 相 关 的 
讨论 参见 附录 C。 第 二 个 问题 则 能 够 用 模板 缓冲 区 来 解决 。 


11.4.1 镜像 概述 


注意 Note Ce 


在 绘制 镜像 时 ， 我 们 也 需要 将 光源 反映 到 镜子 所 在 的 平面 内 ， 否 则 
会 造成 镜像 中 的 光照 不 够 精准 。 





图 11.2 展 示 了 一 个 物体 镜像 的 绘制 过 程 ， 我 们 只 需 将 它 反 射 到 镜面 
的 背面 即 可 。 可 是 这 样 一 来 却 引 入 了 图 11.1 所 示 的 问题 ， 即 物体 (这 个 
示例 中 是 船 通 头 ) 的 镜像 仅仅 是 场景 中 的 力 一 个 “实物 ”而 已 ， 如 果 没 有 
其 他 东西 遮挡 ， 就 能 直接 看 到 它 。 然 而 ， 现 实 中 的 镜像 却 只 有 在 镜子 中 
才能 看 到 。 要 解决 这 个 问题 ， 就 要 用 到 模板 缓冲 区 技术 ， 借 此 即 可 阻止 
后 台 组 冲 区 中 特定 区 域 的 泻 染 操作 。 因 此 ， 超 出 镜面 范围 的 船 仍 头 镜像 
绘制 操作 便 会 被 模板 缓冲 区 制止 。 下 面 所 列 的 是 实现 该 效果 的 步 又 要 
点 。 











1. 将 地 板 、 墙 壁 以 及 髓 骨 头 实物 照 第 泻 染 到 后 台 绥 冲 区 内 不 包 
括 镜 子 ) 。 注 意 ， 此 步骤 不 修改 模板 缓冲 区 。 


2. 清理 模板 缓冲 区 ， 将 其 整体 置 零 。 图 11.3 展 示 了 此 时 的 后 台 绥 
冲 区 与 模板 缓冲 区 中 的 情况 (为 了 简单 起 见 ， 这 里 用 立方 体 瞧 代 髓 令 头 
实物 ) 。 


i 
A | 


图 11.2 ”图 中 展示 的 是 观察 者 在 镜面 中 查看 盒子 镜像 的 原理 。 为 了 模拟 这 个 场景 ， 
我 们 会 在 镜面 背后 反射 出 盒子 的 镜像 ， 而 在 镜面 外 侧 则 像 以 往 那样 泻 染 盒 体 实 物 





















































后 台 缓冲 区 模板 缓冲 区 























图 11.3 ”将 地 板 、 墙 壁 与 骼 髓 头 都 绘制 到 后 台 缓 冲 区 中 ， 并 将 模板 缓冲 区 清理 为 0〈 用 浅 灰色 来 





表示 ) 。 
绘制 在 模板 缓冲 区 中 的 黑色 轮廓 线条 反映 的 是 : 后 台 绥 冲 区 与 模板 缓冲 区 中 像素 之 间 的 对 照 关 
系 ， 





而 并 非 模 板 缓冲 区 中 所 绘 的 实际 数据 


3. 仪 将 镜面 演 染 到 模板 缓冲 区 中 。 大 要 禁止 其 他 颜色 数据 写 入 到 
后 台 绥 种 区 ， 可 用 下 列 设 置 所 创建 的 混合 状态 : 


D3D12_RENDER_TARGET_BLEND_DESC: :RenderTargetWriteMask = 0; 





再 通过 以 下 配置 来 禁止 向 深度 缓冲 区 的 写 操作 : 





D3D12_DEPTH_STENCIL DESC: :DepthWriteMask = D3D12 DEPTH WRITE MASK_ZERO; 


在 回 模 板 缓冲 区 演 染 镜面 的 时 候 ， 我 们 将 模板 测试 设置 为 每 次 都 成 
功 (D3D12_ COMPARISON ”FUNC_ALNAYS) ， 并 且 在 通过 测试 时 用 
1 (StencilRef 模 板 参 考 值 ) 来 蔡 换 (通过 
D3D12_STENCIL_OP_REPLACE 来 设置 ) 模板 绥 冲 区 元 素 。 如 果 深 上 度 测试 
失败 《〈 这 是 有 可 能 发 生 的 ， 例 如 当 骼 仍 头 遮 住 部 分 镜子 的 时 候 ) ， 则 应 
当 采 用 枚 举 项 D3D12_STENCIL_OP_KEEP， 使 模板 缓冲 区 中 的 对 应 像素 
保持 不 变 。 由 于 仪 向 模板 缓冲 区 绘制 了 镜面 ， 因 此 在 模板 缓冲 区 内 ， 除 
了 镜面 可 见 部 分 的 对 应 像素 为 1， 其 他 像素 第 为 0。 图 11.4 所 示 的 即 为 更 
新 后 的 模板 缓冲 区 。 换 言 之 ， 我 们 其 实 就 是 在 模板 缓冲 区 中 标记 了 镜面 
的 可 见 像 系 而 已 。 


























后 台 缓 冲 区 模板 缓冲 区 





图 11.4 把 镜面 泻 染 到 模板 缓冲 区 中 ， 甚 实 就 是 在 模板 缓冲 区 中 标记 出 镜面 可 视 部 分 的 对 应 像 

素 。 模 板 缓冲 区 中 实心 黑色 区 域 的 模板 元 素 取 值 为 1。 但 请 注意 ， 由 于 被 立方 体 挡住 部 分 的 深度 

测试 会 失败 ， 所 以 在 模板 缓冲 区 中 的 这 一 范围 内 ， 元 素 的 取 值 并 不 为 1〈 立 方 体 与 黑色 镜面 重合 
的 部 分 ， 也 就 是 立方 体位 于 镜面 前 方 的 这 一 部 分 ) 
































保证 先 绘制 船 通 头 实物 ， 后 将 镜面 泻 染 至 模板 缓冲 区 的 顺序 是 很 重 
要 的 。 这 样 一 来 ， 深 度 汕 试 的 失败 会 令 镜面 的 像素 被 船 通 头 实物 的 像素 





所 遮挡 ， 因 而 也 就 不 必 再 对 模板 缓冲 区 进行 二 次 修改 了 。 我 们 并 不 希望 
把 模板 缓冲 区 中 镜面 被 让 挡 部 分 的 值 设 为 1， 那 样 将 导致 在 船 通 头 实物 
位 于 镜面 前 方 的 范围 内 也 能 显示 出 镜面 内 容 。 


4. 现在 我 们 来 将 船 通 头 的 镜像 泻 染 至 后 台 绥 冲 区 及 模板 缓冲 区 
中 。 前 面 曾 提 到 ， 只 有 通过 模板 测试 的 像素 才能 泻 染 至 后 台 绥 冲 区 。 对 
此 ， 我 们 便 将 其 设置 为 : 仅 当 模板 缓冲 区 中 的 值 为 1 时 ， 才 能 通过 模板 
测试 。 这 可 以 通过 令 stencilRef 为 1， 且 模板 运算 符 
为 D3D12_COMPARISON_FUNC_EQUAL 来 实现 。 如 此 一 来 ， 只 有 模板 缓冲 
区 中 元 素数 值 为 1 的 蒿 通 头 镜像 部 分 才能 得 以 泻 染 。 由 于 只 有 镜面 可 见 
部 分 所 对 应 的 模板 缓冲 区 中 元 素数 值 为 ，， 所 以 仅 有 这 一 范围 内 的 髓 骨 
头 镜像 才能 被 演 染 出 来 。 














5. 最 后 ， 我 们 像 往 第 那样 将 镜面 演 染 到 后 台 缓 冲 区 中 。 但 是 ， 为 
了 能 “ 透 过 ”镜面 观察 船 仍 头 的 镜像 〈 它 实际 位 于 镜子 的 背面 。 虽 说 展现 
的 是 镜面 内 的 镜像 ， 但 实际 上 是 镜面 背后 的 反射 实物 与 镜面 透明 意 合 所 
得 到 的 效果 〉 ， 我 们 就 需要 运用 透明 混合 技术 来 渲染 镜面 。 知 非 如 此 ， 
则 由 于 骼 通 头 镜像 的 深度 值 小 于 镜面 的 深度 值 ， 理 所 当然 地 会 致使 船 通 
头 镜像 被 镜子 挡住 。 为 此 ， 我 们 只 需 为 镜面 定义 一 个 新 的 材质 配置 实 
例 : 将 其 漫 反 射 alpha 通 道 分 量 设 为 0.3， 使 镜子 的 不 透明 度 达 到 30%， 
并 按 第 10.5.4 小 市 中 所 述 的 透明 混合 状态 来 泻 染 镜面 。 























auto icemirror = std::make unique<Material>(); 
icemirror->Name = "icemirror"; 
icemirror->MatCBIndex = 2; 


ijcemirror->DiffuseSrvHeapIndex = 2; 
icemirror->DiffuseAlbedo = XxmFLOAT(1.6f,1.6f,1.6f,6.3f); 
icemirror->FresnelR@ = XMFLOAT3(86.1f, 68.1f, 8.1f); 
icemirror->Roughness = 0.5f; 





上 述 设 置 可 用 下 列 混合 公式 来 表示 : 
C=0.3.G0+0.7.Cg 
假设 已 经 将 髓 骨 涉 镜像 的 像素 置 于 后 台 绥 冲 区 内 ， 那 么 ， 此 时 我 们 


所 看 到 的 镜像 颜色 30% 来 目镜 子 〈 源 像 率 ) ，70% 出 目 船 通 头 镜像 《〈 目 
标 像素 ) 。 


11.4.2 定义 镜像 的 深度 /模板 状态 


为 了 实现 上 述 算法 ， 我 们 要 用 到 两 个 PSO 对 象 。 第 一 个 用 于 在 绘制 
镜面 时 标记 模板 缓冲 区 内 镜面 部 分 的 像 系 ， 第 二 个 则 用 于 绘制 镜面 可 见 
部 分 〈 即 不 被 前 侧 实物 所 遮挡 部 分 ) 内 的 船 通 头 镜像 。 





// 
// 用 于 标记 模板 缓冲 区 中 镜面 部 分 的 PSO 
// 


// 禁止 对 泻 染 目标 的 写 操 作 
CD3DX12 BLEND DESC mirrorBlendState(D3D12 DEFAULT); 
MirrorBlendstate.RenderTarget[6].RenderTargetWriteMask =0; 


D3D12 DEPTH_STENCIL DESC mirrorDSsSs; 
mirrorDSS.DepthEnable = true; 

mirrorDSS.DepthwriteMask = D3D12 DEPTH_ WRITE MASK ZERO; 
mirrorDSS.DepthFunc = D3D12 COMPARISON FUNC LESS; 
mirrorDSsSS.StencilEnable = true; 
mirrorDSS.StencilReadMask = 0xff; 
mirrorDSS.StencilWriteMask = Oxff; 


mirrorDSsS.FrontFace.StencilFailOp = D3D12 STENCIL OP_KEEP; 
mirrorDSS.FrontFace.StencilDepthFailOp = D3D12 STENCIL OP_ KEEP; 


mirrorDSS.FrontFace.StencilpassOp 
mirrorDSsS.FrontFace.StencilFunc = 


// 我 们 不 泻 染 背面 朝 向 的 多 边 形 ， 








= D3D12_STENCIL_OP_REPLACE ; 
D3D12_COMPARISON_FUNC_ALWAYS; 





因而 对 这 些 参数 的 设置 并 不 关心 








mirrorDSS.BackFace.StencilFailOp = D3D12_STENCIL_OP_KEEP; 
mirrorDSS .BackFace.StencilDepthFailOp = D3D12_ STENCIL_OP_KEEP; 
mirrorDSS.BackFace.StencilpassOp = D3D12 STENCIL OP_ REPLACE; 
mirrorDSS.BackFace.StencilFunc = D3D12 COMPARISON FUNC ALWAYS; 


D3D12_ GRAPHICS_ PIPELINE STATE DESC markMirrorsPsoDesc = 


opaquePsoDesc; 


markMirrorsPsoDesc.BlendState = mirrorBlendState; 


markMirrorsPsoDesc.DepthStencilState = 


mirrorDSss; 


ThrowIfFailed(md3dDevice->CreateGraphicsPipelinestate( 
&markMirrorsPsoDesc， 
IID_PPV_ARGS(&mPSOs[ "markStencilMirrors"]))); 


// 
// 用 于 泻 染 模板 组 ; 


// 














! 区 中 反射 镜像 的 PSO 


D3D12_DEPTH_STENCIL_DESC reflectionsDSS ; 


reflectionsDSS 
reflectionsDSS 
reflectionsDSS 
reflectionsDSS 
reflectionsDSS 
reflectionsDSS 


reflectionsDSS. 
reflectionsDSS. 
reflectionsDSS. 


reflectionsDsS 


// 我 们 这 里 不 对 背面 朝 问 的 多 边 形 进行 泻 染 ， 因 而 这 些 配 置 是 无 足 轻 重 的 
.BackFace 
.BackFace 
.BackFace 


reflectionsDSS. 


reflectionsDSS 
reflectionsDSS 
reflectionsDSS 


D3D12_GRAPHICS_ 2 
drawReflectionsPsoDesc.DepthStencilState = 


.DepthEnable = 
.DepthWriteMask = D3D12 DEPTH WRITE MASK ALL; 
.DepthFunc = D3D12 COMPARISON FUNC_ LESS; 
.StencilEnable = true; 

.StencilReadMask = 6xff; 

.StencilNriteMask = 0xff; 


.FrontFace .StencilFunc = 


true; 


FrontFace.StencilFailOp = D3D12 STENCIL OP KEEP; 
FrontFace.StencilDepthFailOp = D3D12 STENCIL OP_ KEEP; 
FrontFace.StencilPassOp = D3D12 STENCIL OP_ KEEP; 
D3D12_COMPARISON_FUNC_EQUAL; 

















.StencilFailop = D3D12 STENCIL OP_ KEEP; 
.StencilDepthFailOp = D3D12 STENCIL OP_KEEP; 
.StencilPassOp = D3D12 STENCIL OP _ KEEP; 
BackFace.StencilFunc = D3D12 COMPARISON FUNC EQUAL; 
PIPELINE STATE DESC drawReflectionsPsoDesc = 
reflectionsDSsS; 


opaquePsoDesc; 


drawReflectionsPsoDesc.RasterizerState.CullMode = D3D12 CULL MODE BACK; 

drawReflectionsPsoDesc.RasterizerState.FrontCounterClockwise = true; 

ThrowIfFailed(md3dDevice->CreateGraphicsPipelinestate( 
&drawReflectionsPsoDesc, 
IID_PPV_ARGS(&mPpSOs["drawStencilReflections"]))); 





11.4.3 ”绘制 场景 


以 下 代码 概述 了 场景 的 绘制 流程 。 为 了 清晰 和 简洁 起 见 ， 这 里 省 略 
了 诸如 “设置 滑 量 缓冲 区 数据 ?等 的 细 术 未 节 《 上 具体 细 节 可 参见 例 程 的 完 
整 代 码 ) 


// 绘制 不 透明 的 物体 一 地 板 、 墙 壁 、 骼 仍 头 
auto passCB = mCurrFrameResource->PassCB->Resource( ) ; 
mCommandList->SetGraphicsRootConstantBufferView(2, 
passCB->GetGPUVirtualAddress()); 
DrawRenderItems(mCommandList.Get(), mRitemLayer[(int) 
RenderLayer: :Opaque]); 








// 将 模板 缓冲 区 中 可 见 的 镜面 像素 标记 为 1 

mCommandList->OMSetStencilRef(1); 
mCommandList->SetPpipelineState(mpSOs["markStencilMirrors"].Get()); 
DrawRenderItems(mCommandList.Get(), mRitemLayer[(int)RenderLayer: :Mirrors] 


); 


// 从 绘制 镜子 范围 内 的 镜像 ( 即 仅 绘制 模板 缓冲 区 中 标记 为 1 的 像素 ) 
// 注意 ， 我 们 必须 使 用 两 个 单独 的 泻 染 过 程 常量 缓冲 区 (per-pass constant buffer) 来 
完成 此 工作 ， 









































// 一 个 存储 物体 镜像 ， 另 一 个 保存 光照 镜像 
mCommandList->SetGraphicsRootConstantBufferView(2, 
passCB->GetGPUVirtualAddress() + 1 * passCBByteSize); 
mCommandList->SetPpipelineState(mpSOs["drawStencilReflections"].Get()); 
DrawRenderItems(mCommandList.Get(), mRitemLayer[(int)RenderLayer: :Reflecte 


d]); 


// 恢复 主演 染 过 程 常量 数据 以 及 模板 参考 值 

mCommandList->SetGraphicsRootConstantBufferView(2, 
passCB->GetGPUVirtualAddress()); 

mCommandList->OMSetStencilRef(0); 








// 绘制 透明 的 镜面 ， 使 镜像 可 以 与 之 混合 

mCommandList->SetPipelineSstate(mPSOs[ "transparent"] .Get() ) ; 
DrawRenderItems(mCommandList.Get(), mRitemLayer[(int)RenderLayer::Transpar 
ent]); 








关于 以 上 代码 还 有 一 后 需要 注意 ， 即 在 绘 





制 RenderLayer: :Reflected 层 的 时 候 如 何 来 修改 其 演 染 过 程 常 量 缓冲 
区 。 这 是 因为 在 绘制 物体 镜像 的 同时 ， 还 涉及 场景 中 光照 的 镜像 〈 即 ， 
物体 的 镜像 也 要 有 与 之 对 应 的 光照 ) 。 光 源 本 存 于 演 染 过 程 常 量 缓冲 区 
中 ， 因 此 我 们 可 以 再 额外 创建 一 个 演 染 过 程 常量 绥 冲 区 ， 用 以 存储 场景 
中 光照 的 镜像 。 该 常量 缓冲 区 的 设置 方法 如 下 : 





PassConstants StencilApp: :mMainpassCB; 
PassConstants StencilApp: :mReflectedPpassCB; 
void StencilApp: :UpdateReflectedpassCB(const GameTimer& gt) 


{ 
mReflectedPpassCB = mMainpassCB; 


XMVECTOR mirrorPlane = XMVectorSet(6.6f，6.6f，1.6f，6.6f); // xy 平面 
XMMATRIX R = XMMatrixReflect(mirrorPlane); 


// 光照 镜像 
for(int i = 6; i < 3; ++i) 


{ 


XMVECTOR lightDir = XMLoadFloat3(&mMainpassCB.Lights[i].Direction); 
XMVECTOR reflectedLightDir = XMVector3TransformNormal(lightDir, R); 
XMStoreFloat3(&mReflectedPpassCB.Lights[i].Direction, reflectedLightDir 


); 
} 


// 将 光照 镜像 的 泻 染 过 程 常量 数据 存 于 演 染 过 程 常量 缓冲 区 中 索引 1 的 位 置 
auto currPassCB = mCurrFrameResource->PassCB. get(); 
currPpassCB->CopyData(1, mReflectedpassCB); 

} 





























11.4.4” 绕 序 与 镜像 


当 一 个 三 角形 被 反射 到 某 个 平面 上 时 (也 就 是 此 三 角形 在 这 一 平面 
上 的 镜像 ) ， 其 绕 序 (winding order) 并 不 会 发 生 改 变 ， 正 因 如 此 ， 其 
平面 法 线 的 方向 同样 保持 不 变 。 所 以 ， ie 
变 为 了 内 向 法 线 〈 见 图 11.5) 。 此 时 ， 为 了 纠正 这 一 点 ， 我 们 会 告知 


Direct3D 将 逆 时 针 绕 序 的 三 角形 看 作 是 正面 朝 铝 ， 而 将 顺 时 针 绕 序 的 三 
角形 看 作 背 面 朝向 (这 与 我 们 之 前 的 习惯 刚好 相反 一 一 见 5.10.2 市 〉。 
这 实际 上 是 对 法 线 的 方 网 也 进行 了 “反射 >， 以 此 使 镜像 成 为 外 癌 旨 问 。 
我 们 可 以 通过 设置 下 列 PSO 光 栅 化 属性 来 改变 绕 序 的 约定 : 











drawReflectionsPsoDesc.RasterizerState.FrontCounterClockwise = true; 


> 证 


图 11.5 多边 形 的 法 线 不 会 随 着 反射 操作 而 调转 过 来 ， 这 使 得 镜像 的 法 线 都 变 为 内 向 朝向 








11.5 ”实现 平面 阴影 


本 节 中 的 部 分 内 容 选 自 Frank D. Luna 的 Introduction to 3D Game 
Programming with DirectX 9.0c: A Shader Approach, 2006。 出 版 社 为 Jones 


and Bartlett Learning, Burlington, MA. www.jblearning.com。 现 经 许可 摘 
录 于 此 


阴影 有 助 于 体现 场景 中 的 光源 位 置 ， 用 以 加 强 场景 的 真实 感 。 本 市 
将 展示 如 何 实 现 平面 阴影 (planar shadow) ， 即 投射 于 平面 内 的 阴影 
〈( 见 图 11.6) 。 








惠 中 Mirror Demo FPS:1142 Frame Time:0875657ImJ 


二 











图 11.6“Stencil Demo”( 模 板 〉 例 程 中 主 光源 投射 出 的 平面 阴影 


我 们 必须 借助 几何 建 模 的 方式 首先 找到 物体 经 光照 投 癌 平面 的 阴 
影 ， 从 而 泻 染 出 平面 阴影 效果 。 这 可 以 通过 一 些 3D 数 学 知识 来 轻松 实 
现 。 接 下 来 ， 再 运用 表示 阴影 的 50% 透 明度 黑色 材质 来 泻 染 阴影 区 域 中 
的 三 角形 即 可 。 泻 染 阴影 这 类 工作 有 可 能 会 引入 名 为 "双重 混合 〈 也 作 
双 倍 混合 ) ”的 演 染 问题 ， 这 一 概念 会 在 后 续 小 市 中 讲解 ， 届 时 ， 我 们 
将 利用 模板 缓冲 区 来 避免 双重 混合 的 发 生 。 








11.5.1 平行 光阴 影 





图 11.7 展 示 了 由 平行 光源 经 物体 所 投射 出 的 阴影 。 给 定 方 癌 为 荆 的 
平行 光源 ， 并 用 "lt) = P+ 二 来 表示 途经 顶点 P 的 光线 。 光 线 "(H 与 阴影 
平面 4tm; 细 的 交点 为 s。 《读者 可 以 从 附录 C 中 获取 更 多 关于 光线 〈 射 线 ) 
与 平面 相交 的 数学 知识 。) 以 此 光源 射出 的 光线 照射 到 物体 的 各 个 项 
点 ， 用 这 些 上 映射 到 平面 上 的 交点 集合 便 可 以 定义 几何 体 所 投射 出 的 阴影 
形状 。 对 于 项 点 P 来 说 ， 它 的 阴影 投影 可 由 下 列 公式 求 出 : 








n-:p+d 
L 
nL (11.1) 





s 一 7 大) 一 也 





r(t) 





及 


图 11.7 平行 光源 及 其 投射 阴影 的 示意 图 
光线 与 平面 的 相交 测试 细节 可 参见 附录 C。 


开 (11.1) :本 写作 窜 阵 有 鸭 形 我 。 


nL— Linzr —Lynz —L.nzr 0 

/ 3 —Lzrny 72 L = Lyny —L:ny 0 

3s = Ip: py Pp: J —Lin. —Lyn: n:L—L.n. 0 
一 rd —Lyd —L.d n:L 


我 们 称 以 上 的 4 x 4 矩阵 为 方向 光阴 影 矩 阵 (directional shadow 
matrix， 也 译作 平行 光阴 影 矩 阵 ) ， 用 Su 表示。 为 了 证 明 此 矩阵 与 式 
(11.1) 是 等 价 的 ， 我 们 用 乘法 运算 来 加 以 验证 。 首 先 可 以 看 出 ， 此 甜 
阵 改变 了 uw 分 量 ， 即 5% 二. 工 。 这 样 一 来 ， 当 执行 透视 除法 (参见 第 


5.6.3.4 小 节 ) 时 ，s 中 的 每 个 坐标 都 会 除 以 n . L， 这 便 是 矩阵 能 做 到 式 
(11.1) 中 相应 除法 运算 的 原因 。 现 在 通过 矩阵 乘法 来 求 出 第 ;个 投影 顶 
点 的 坐标 5， 其 中 i € { 1, 2, 3。 在 透视 除法 完成 之 后 ， 我 们 有 : 





(nL)pi— Linzpz — Linypy — Lin:p: — Lid 











a nL 
(nn: Lpi—(n:p+dL: 
加 n:L 
n-:p+d 
nL 


此 结果 与 用 式 (11.1) 求 出 的 s 中 的 第 ;个 坐标 完全 相同 ， 因 此 s = s/ 


为 了 运用 阴影 窍 阵 ， 我 们 将 它 与 世界 矩阵 组 合 在 一 起 。 但 是 ， 在 世 
界 变 换 之 后 ， 由 于 透视 除法 还 没有 执行 ， 因 而 几何 体 的 阴影 还 未 被 投射 
到 阴影 平面 上 。 此 时 便 出 现 了 一 个 问题 : 若 5 三味 了 二 4， 则 w 坐 标 将 
变 为 负 值 。 在 透视 投影 的 处 理 过 程 中 ， 我 们 一 般 将 :坐标 复制 到 ww 坐标 ， 
在 wu 坐标 为 负 值 则 表明 此 点 位 于 视 锥 体 之 外 而 应 将 其 裁 甬 摊 〈 裁 盘 操 作 
在 透视 除法 之 前 的 齐 次 空间 内 执行 ) 。 这 对 于 平面 阴影 来 讲 是 个 大 问 
题 ， 因 为 除了 计算 透视 除法 之 外 ， 我 们 还 要 用 uw 坐标 来 实现 阴影 效果 。 
图 11.8 就 展示 了 这 样 一 种 m :三 < 0 却 存在 阴影 的 情况 ， 但 此 时 这 个 阴影 
却 无 法 显示 出 来 。 








为 了 纠正 这 个 问题 ， 我 们 用 指向 无 穷 远 处 光源 的 方向 向 量 五 = -L 
来 取代 光线 方向 向 量 五 。 可 以 看 出 ，r 人 = 了 + 二 与 r( 风 = 了 + 纪 定 义 的 
是 相同 的 3D 直 线 ， 且 该 直线 与 平面 之 间 的 交点 也 是 一 致 的 〈 利 用 不 同 
的 交点 参数 值 {, 来 弥补 5 与 之 间 的 符号 差异 ) 。 因 此 使 用 无 = -会 得 到 








与 二 相同 的 计算 结果 ， 但 是 前 者 会 保证 m : 王 > 0， 以 此 来 绕 开 w 坐 标 为 负 
值 的 这 个 坑 。 





图 11.8 图 中 所 示 的 是 一 种 有 :下 二 0 的 情况 


L 





图 11.9 点 光源 及 其 投射 阴影 的 示意 图 


11.5.2 点 光阴 影 


图 11.9 展 示 了 位 于 扣 L 处 的 点 光源 所 投射 出 的 物体 阴影 。 从 扣 光 源 
发 出 的 途经 任意 顶点 P 的 光线 可 由 "7(t) = P+tlp 一 荆 来 表示 。 光 线 "( 与 
阴影 平面 (mw; 的 交点 为 s。 以 此 光源 发 出 的 光线 经 过 物体 的 每 个 顶点 ， 
这 映射 在 平面 的 交 后 集合 便 定义 了 几何 体 所 投 册 出 的 阴影 形状 。 对 于 项 
扩 P 而 言 ， 其 阴影 投影 可 以 表示 为 : 





(t,) ni-:p+d L) 
=T(t) =p— (Dp 
mL (PP 一世) (11.2) 
式 (11.2) 也 可 以 写作 和 矩阵 方 程 : 
n:-:L+i+d—Linzr —Lynz —L-nzr —TLz 
SG _- —Lzrny n:L+i+d—o Lyny —L:ny 一 97/ 
pom —Lin. —Lyn. n:L+i+d—L.n. —n. 
—Lzid —Lyd —L.d n:L 


为 了 证 明 此 和 矩阵 等 价 于 式 (11.2〉， 我 们 就 以 上 一 节 中 同样 的 办 
法 ， 用 矩阵 进行 乘法 和 运算。 观察 到 最 后 一 列 中 并 没有 0 项 ， 则 有 : 


su = —prnr— pyny— pn:+n:L 
=—DpD:n+n:L 
一 一 到 . (万 一 五 ) 


这 就 是 式 〈11.2) 中 分 母 部 分 的 相反 数 ， 我 们 可 以 通过 将 分 子 与 分 
母 同 时 乘 以 -1， 使 二 者 一 致 。 


注 意 Note Ce 








对 于 点 光 与 平行 光 而 言 ， 五 充当 着 不 同 的 角色 。 在 使 用 点 光 时 ， 王 


定义 了 点 光源 的 位 置 。 在 使 用 平行 区 时 ， 我 们 却 用 元 来 定义 指 回 无 穷 远 
处 光源 的 方向 向 量 〈 即 与 平行 光 光 线 传播 方 回 相反 的 向 量 〉。 


11.5.3 ”通用 阴影 矩阵 





我 们 可 通过 齐 次 坐标 创建 出 一 个 能 同时 应 用 于 点 光 与 方向 光 的 通用 
阴影 矩阵 。 


1. 如 果 Lw = 0， 则 LL 表示 指 癌 无 穷 远 处 光源 的 方向 癌 量 〈 即 与 平行 
光 光 线 传 播 方向 相反 的 问 量 ) 。 


如 果 Zv = 1， 则 五 表示 点 光 的 位 置 。 


接 下 来 ， 我 们 用 下 列 阴 影 是 阵 〈shadow matrix) 来 表示 由 顶点 P 到 
其 投影 s 的 变换 : 


nL+dLy,— Lnzr —Lynz —L-nz —Lionzr 
Sg —Lzrny n:L+dLy— Lyny —L:ny —Luny 
—Lin. —Lyn. n:L+daL,— Ln. —Lyn. 
—Lid —Lyd —L.d n:L 
显然 ， 如 果 Zv =0， 则 Ss 将 化 简 为 ?dr， 知 Zv = 1， 则 Ss 将 化 简 为 
S 


Point 。 


DirectX 的 数学 库 提 供 了 以 下 函数 ， 用 以 构建 在 特定 平面 内 投射 阴 
影 所 用 的 相应 阴影 窍 阵 ， 耕 w = 0 表示 平行 光 ， 而 w = ] 则 表示 点 光 : 


inline XMMATRIX XM CALLCONV XMMatrixShadow( 
FXMVECTOR ShadowPlane, 
FXMVECTOR LightPosition); 


[Blinn96] 与 [Moller02] 可 作为 拓展 阅读 ， 它 们 都 讨论 了 平面 阴影 的 
相关 内 容 。 


11.5.4 ”使 用 模板 缓冲 区 防止 双重 混合 





将 物体 的 几何 形状 投射 到 平面 而 形成 阴影 时 ， 可 能 《实际 上 也 经 常 
II 若 此 时 用 透明 度 

一 混合 技术 来 泻 染 阴 影 ， 则 这 些 三 角形 的 重 芭 部 分 会 混合 多 次 ， 使 之 
看 起 来 更 暗 。 图 11.10 即 说 明了 这 一 点 。 





这 个 问题 可 以 通过 模板 缓冲 区 来 解决 。 


1. 首先 ， 保 证 参与 泻 染 阴 影 的 模板 缓冲 区 中 的 阴影 范围 像素 都 已 
被 清理 为 0。 由 于 “Stencil Demo” 演 示 程 序 只 同 地 面 投射 一 种 阴影 ， 所 以 
这 样 做 也 是 合情合理 的 ， 而 且 我 们 仅 需 修改 阴影 的 模板 缓冲 区 中 的 像素 
即 可 。 











2. 设置 模板 测试 ， 使 之 仅 接受 模板 缓冲 区 中 元 素 为 0 的 像素 。 如 宋 
通过 模板 测试 ， 则 将 相应 模板 缓冲 区 值 增 为 1。 





图 11.10 ”可 以 看 到 ， 左 图 阴影 中 存在 颜色 更 暗 的 “粉刺 ”(acne) 部 分 。 这 些 区 域 即 为 骼 仍 头 平 
面 投影 三 角形 重合 的 部 分 ， 由 此 便 导 致 了 “双重 混合 ”的 发 生 。 因 为 右 图 没有 进行 双重 混合 ， 所 
以 演 染 出 的 是 正确 的 阴影 效果 














在 第 一 次 演 染 阴影 像素 时 ， 由 于 模板 缓冲 区 元 素 为 0， 因 而 模板 调 
试 会 成 功 。 演 染 该 像 系 的 同时 ， 我 们 也 会 将 对 应 的 模板 缓冲 区 元 素 增加 
为 1。 这 样 一 来 ， 如 果 试 图 复写 已 被 泻 染 过 的 区 域 ， 则 模板 测试 会 失 
败 。 这 将 防止 同一 像素 被 绘制 多 次 ， 继 而 阻止 双重 混合 的 发 生 。 


11.5.5 ”编写 阴影 部 分 的 代码 


我 们 把 用 于 绘制 阴影 的 材质 定义 为 具有 50% 透 明度 的 黑色 材质 : 


auto shadowMat = std::make unique<Material>(); 
shadowMat->Name = "shadowMat"; 
shadowMat->MatCBIndex = 4; 


shadowMat->DiffuseSrvHeapIndex = 3; 

shadowMat->DiffuseAlbedo = XMFLOAT4(6.6f, 0.6f, 8.6f, 96.5f); 
shadowMat->FresnelR@ = XMFLOAT3(8.601f, 6.601f, 868.6061f); 
shadowMat->Roughness = 6.6f; 





为 了 防止 双重 混合 ， 我 们 用 下 列 的 深度 /模板 状态 来 设置 PSO: 





// 以 下 列 深度 /模板 状态 来 防止 双重 混合 的 发 生 
D3D12_DEPTH_STENCIL_DESC shadowDss ; 
shadowDSS .DepthEnable = true; 


shadowDSSs .DepthWriteMask = D3D12 DEPTH WRITE MASK ALL; 
shadowDSS .DepthFunc = D3D12 COMPARISON FUNC_ LESS; 
shadowDSS .StencilEnable = true; 

shadowDSS .StencilReadMask = 6xff; 

shadowDSS .StencilWriteMask = Oxff; 


shadowDSss .FrontFace.StencilFailOp = D3D12 STENCIL OP KEEP; 
shadowDSS .FrontFace.StencilDepthFailOp = D3D12 STENCIL OP_ KEEP; 





// 由 于 并 不 泻 染 背 面 朝向 的 多 边 形 ， 因 此 这 些 配置 都 是 无 关 紧 要 的 
shadowDSS .BackFace.StencilFailOp = D3D12 STENCIL OP KEEP; 
shadowDSss .BackFace.StencilDepthFailOp = D3D12 STENCIL OP KEEP; 
shadowDSS .BackFace.StencilpassOp = D3D12 STENCIL OP_INCR; 
shadowDSS .BackFace.StencilFunc = D3D12 COMPARISON FUNC EQUAL; 











D3D12 GRAPHICS PIPELINE STATE DESC shadowPsoDesc = transparentPsoDesc; 
shadowPsoDesc.DepthStencilState = shadowDSs ; 
ThrowIfFailed(md3dDevice->CreateGraphicsPipelinestate( 

&shadowPsoDesc， 

IID_PPV_ARGS(&mPSOs["shadow"] ) ) ) ; 





接着 用 Stencil1Ref 值 为 0 的 阴影 PSO 来 绘制 船 仍 头 阴 影 : 


// 绘制 阴影 

mCommandList->OMSetStencilRef(0); 
mCommandList->SetPpipelineState(mpSOs["shadow"].Get()); 
DrawRenderItems(mCommandList.Get(), mRitemLayer[(int)RenderLayer: :Shadow] ) ; 








在 这 里 ， 角 通 头 阴影 泻 染 项 的 世界 矩阵 是 这 样 计 算 的 : 


// 更 新 阴影 的 世界 矩阵 
XMVECTOR shadowPlane = XMVectorSet(6.6f，1.6f，6.6f，6.6f); // xz 平面 
XMVECTOR toMainLight = -XMLoadFloat3(&mMainpassCB.Lights[8].Direction); 




















XMMATRIX S = XMMatrixShadow(shadowPlane, toMainLight); 

XMMATRIX shadowOffsetY = XMMatrixTranslation(68.6f, 68.601f, 8.6f); 
XMStoreFloat4x4(&mShadowedSkullRitem->World, skullWorld * S * shadowOffset 
Y); 





注意 ， 我 们 将 投影 网 格 沿 痢 y 轴 做 了 少量 的 偶 移 调整 ， 以 防 发 生 深 
度 冲 突 (z-fighting〉， 所 以 阴影 网 格 不 会 与 地 板 网 格 相 交 ， 得 到 的 最 终 


效果 是 阴影 会 略 高 于 地 板 。 如 宋 这 两 种 网 格 相 交 ， 则 由 于 深度 缓冲 区 的 
精度 限制 ， 将 导致 地 板 与 阴影 的 网 格 像素 为 了 各 目的 完全 显现 而 发 生 闪 
烁 的 现象 所 。 


11.6 ”小结 





1. 模板 缓冲 区 是 一 种 离 屏 缓冲 区 ， 我 们 可 以 通过 它 来 阻止 特定 像 
素 片段 向 后 台 缓冲 区 的 泻 染 操作 。 由 于 模板 缓冲 区 与 深度 缓冲 区 分 辩 率 
相同 ， 所 以 两 者 可 以 联合 使 用 。 深 度 /模板 缓冲 区 的 有 效 格式 
为 DXGI_FORMAT_D32 FLOAT _S8X24_UINT 
与 DXGI_FORMAT_D24_UNORM _S8_UINT。 


2. 是 否 可 问 特 定 的 像素 执行 写 操 作 都 取决 于 模板 测试 ， 该 测试 过 
程 如 下 : 


if( StencilRef & StencilReadMask 3 Value & StencilReadMask ) 


accept pixel 
else 
reject pixel 


其 中 ， 运 算 符 4 是 枚 举 类 型 D3D12_COMPARISON_FUNC 中 定义 的 函数 
之 一 。StencilRef、 StencilReadMask 与 比较 运算 符 4 丝 是 程序 中 定 
义 且 以 Direct3D 深 度 /模板 API 设 置 的 比较 数值 。Value 即 当前 正在 比较 
中 的 模板 缓冲 区 像素 值 。 





3. 深度 /模板 状态 是 PSO 描 述 的 一 部 分 。 通 过 填写 
D3D12_GRAPHICS PIPELINE STATE_DESC: :Depthstencilstate 字 段 
便 可 配置 深度 /模板 状态 ， 而 Depthstencilstate 的 类 型 则 
为 D3D12_DEPTH_STENCIL_DESC。 


4. 模板 参考 值 
由 ID3D12GraphicsCommandList::OMSetStencilRef 方 法 来 设置 ， 需 
要 传 入 一 个 无 符号 整数 作为 参数 来 指定 模板 参考 值 。 


11.7 练习 


1. 证 明 : 如 果 Lw = 0， 则 通用 阴影 矩阵 Ss 将 化 简 为 3dr;， 而 Lw = 1 
则 Ss 将 化 简 为 Spoint。 


2. 就 像 我 们 在 11.5.1 市 中 计算 方 辐 光 平面 阴影 所 做 的 那样 ， 通 过 对 


n-:p+d 
\ HL 一 ~ y SC p 1 \ 
顶点 的 每 个 分 量 进行 矩阵 乘法 来 证 明 n:.(p—Ii) 





(p L)= PS point 


3. 修改 “Stencil Demo” 演 示 程 序 ， 生 成 图 11.1 左 图 所 示 的 效果 。 





4. 修改 “Stencil Demo” 演 示 程 序 ， 生 成 图 11.10 左 图 所 示 的 效果 。 


5. 通过 下 列 步 又 修改 “Stencil Demo” 演 示 程 序 。 首 先 用 下 面 的 深度 
状态 来 绘制 一 堵 墙 : 


depthStencilDesc.DepthEnable = false; 


depthStencilDesc.DepthWwriteMask = D3D12 DEPTH WRITE MASK ALL; 
depthSstencilDesc.DepthFunc = D3D12_COMPARISON_FUNC_LESS ; 








接 下 来 ， 再 以 如 下 深度 状态 来 绘制 场 后 的 船 通 头 : 


depthSstencilDesc.DepthEnable = true; 


depthSstencilDesc.DepthWwriteMask = D3D12 DEPTH WRITE MASK ALL; 
depthStencilDesc.DepthFunc = D3D12 COMPARISON FUNC_ LESS; 





墙壁 会 诞 挡 船 通 头 吗 ? 请 做 出 解释 。 如 果 按 下 列 设置 来 绘制 墙壁 会 
发 生 什 么 呢 ? 


depthStencilDesc.DepthEnable = true; 
depthStencilDesc.DepthWriteMask = D3D12 DEPTH WRITE MASK ALL; 





depthStencilDesc.DepthFunc = D3D12 COMPARISON FUNC_LESS; 


注意 ， 此 练习 不 涉及 模板 缓冲 区 ， 所 以 应 将 它 茶 用。 


6. 修改 “Stencil Demo” 演 示 程 序 。 若 以 不 调转 三 角形 的 绕 序 约定 为 
前 提 ， 能 否 正确 地 泻 染 出 髓 体 头 镜像 ? 


7. 修改 第 10 章 中 的 “Blend Demo” (混合 ) 演示 程序 : 在 场景 的 中 
心 绘制 一 个 (没有 上 底 与 下 底 的 ) 圆柱 体 。 该 圆柱 体 的 纹理 采用 的 是 60 
帧 螺旋 电流 动画 ， 在 本 章 目录 下 BS 找到 此 素材 ， 并 以 累加 混合 (additive 
blending) 的 方式 来 实现 此 效果 。 图 11.11 展 示 了 此 示例 的 最 终 效果 。 
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图 11.11 练习 7 答案 的 效果 


可 参考 10.5.5 节 中 ， 以 累加 混合 的 方式 渲染 几何 体 时 所 使 用 的 深度 








8. 深度 复杂 性 (depth complexity， 或 深度 复杂 度 ) 是 指 通过 深度 
测试 竞争 ， 回 后台 绥 冲 区 中 某 一 特定 元 素 写 入 像素 卢 段 的 次 数 。 例 如 ， 
一 个 本 已 绘制 好 的 像素 可 能 被 更 靠近 摄像 机 的 像素 所 履 写 (整个 场景 虽 
然 绘 制 完成 ， 但 在 确定 最 靠近 摄像 机 的 像素 之 前 ， 这 种 重复 绘制 的 情况 
还 是 会 发 生 若干 次 ) 。 如 图 11.12 所 示 ， 像 素 P 的 深度 复杂 性 为 3， 因 为 
在 该 像素 上 共有 3 种 像素 片段 。 























图 11.12 ”竞相 泻 染 到 投射 窗口 上 某 一 像素 的 多 个 像素 片段 。 在 此 场景 中 ， 像 素 避 的 深度 复杂 性 
为 3 





事实 上 ， 显 卡 可 能 会 在 每 一 帧 中 将 茶 一 像素 填充 多 次 。 这 种 重复 给 
制 (overdraw) 的 行为 会 对 性 能 造成 影响 ， 因 为 显卡 把 时 间 浪 费 在 了 和 才 


写 最 终 看 不 到 的 像素 上 上。 因此， 度量 场景 中 的 深度 复杂 性 对 于 性 能 分 析 
是 很 有 意义 的 。 








我 们 可 按 下 列 方法 来 衡量 深度 复杂 性 : 用 模板 缓冲 区 来 泻 染 场景 } 
把 它 作为 计数 器 ， 即 将 模板 缓冲 区 中 每 个 像素 的 初始 值 清 理 为 0， 在 每 
次 处 理 像素 片段 时 ， 用 D3D12_STENCIL_OP_INCR 方 法 令 其 计数 递增 。 
对 于 任 一 像素 片段 的 写 入 操作 而 言 ， 应 当 总 是 对 它 相应 的 模板 缓冲 区 元 
素 值 加 1， 所 以 我 们 采用 模板 比较 函 
数 D3D12_COMPARISON_FUNC_ALWAYS。 举 个 例子 ， 在 一 帧 绘制 完毕 
后 ， 寿 第 ; 行 、 第 7] 列 像素 的 对 应 模板 缓冲 区 元 素 值 为 5， 则 表示 该 像素 
在 此 帧 的 绘制 过 程 中 共 被 写 入 了 5 次 像素 片段 ( 即 此 像素 的 深度 复杂 性 
为 5〉。 注 意 ， 严 格 来 讲 ， 在 统计 深度 复杂 性 时 ， 我 们 只 需 将 场景 演 染 
到 模板 缓冲 区 即 可 。 











为 了 使 ( 存 于 模板 缓冲 区 中 的 ) 深度 复杂 性 可 视 化 ， 可 进行 如 下 处 
于 。 


a. 令 颜 色 ck 与 深度 复杂 性 关联 起 来 。 比 如 说 ， 蓝 色 对 应 深度 复杂 性 
1、 绿 色 对 应 深度 复杂 性 2、 红 色 对 应 深度 复杂 性 3 等 。《〈 在 极其 复杂 的 
场景 中 ， 一 些 像素 的 深度 复杂 性 值 可 能 非常 大 ， 因 此 ， 我 们 也 许 不 希望 
为 每 个 级 别 都 逐一 设 定 颜色 。 此 时 ， 我 们 便 可 以 将 一 系列 没有 交集 的 连 
续 级 别 关联 为 同一 种 颜色 。 例 如 ， 设 置 深度 复杂 性 为 1 一 5 的 像素 为 蓝 
色 ， 深 度 复 杂 性 为 6 一 10 的 像素 为 绿色 等 。) 








b. 设 定 模板 缓冲 区 的 运算 方法 为 D3D12_STENCIL_OP_KEEP， 即 我 





们 不 会 对 它 进 行 任何 修改 。《〈 当 随 着 场景 的 泻 染 过 程 而 统计 深度 复杂 性 
时 ， 我 们 用 D3D12_STENCIL_OP_INCR 来 修改 模板 缓冲 区 。 但 是 ， 为 模 
板 缓冲 区 的 可 视 化 而 编写 代码 时 ， 我 们 仅 需 从 模板 缓冲 区 该 取 数据 而 不 
应 向 其 写 入 数据 。) 














c. 对 于 每 种 深度 复杂 性 的 级 别 K 而 言 : 


(i) 设置 模板 比较 函数 为 D3D12_COMPARISON_FUNC_EQUAL， 且 设 
定 模板 参考 值 为 。 








(站) 用 4 种 颜色 ct 来 绘制 整个 投影 窗口 内 容 。 注 意 ， 根 据 前 面 所 设 
置 的 模板 比较 函数 与 模板 参考 值 可 以 判断 ， 只 有 深度 复 茶 性 为 的 像素 
才能 被 着 色 并 显示 出 来 。 





经 过 这 一 系列 的 配置 过 程 ， 我 们 融 能 根据 每 个 像素 目 身 的 深度 复杂 
性 来 为 它 上 色 ， 并 以 此 来 方便 地 观察 场景 中 深度 复 杂 性 的 分 布 情况 。 对 
于 此 练习 来 说 ， 我 们 借用 第 10 半 中 的 “Blend Demo” 演 示 程 序 来 泻 染 出 其 
场景 的 深度 复杂 性 。 图 11.13 展 示 了 该 示例 的 一 个 效果 。 





























图 11.13 ”练习 8 答案 的 对 比 效果 


深度 测试 发 生 于 演 染 流水 线 像素 着 色 器 阶段 之 后 的 输出 合并 阶段 。 
这 意味 着 即使 某 像素 片段 最 终 可 能 被 深度 测试 丢弃 ， 它 也 要 经 像素 着 色 
器 处 理 一 番 。 然 而 ， 现 代 硬 件 在 处 理 像 素 着 色 器 之 前 会 执行 一 种 称 
为 “提前 z 测 试 ”(early z-test) 的 深度 测试 。 如 此 一 来 ， 一 个 在 后 续 处 理 
过 程 中 将 被 剔除 的 像素 片段 ， 可 能 在 被 开销 很 高 的 像素 着 色 器 处 理 之 前 
便 被 舍 去 了 。 要 使 用 这 种 优化 技术， 我 们 应 当 和 尝试 按 距离 摄像 机 由 近 及 
远 的 顺序 来 泻 染 非 混 合 的 游戏 对 象 。 按 照 这 种 做 法 ， 离 摄像 机 最 近 的 物 
体 将 被 首先 绘制 ， 其 后 的 物体 会 在 提前 z 测 试 中 不 予 通过 ， 继 而 不 参与 
后 续 的 处 理 流 程 。 大 处理 的 场景 因 较 高 的 深度 复杂 性 而 需要 大 量 的 重新 
绘制 工作 ， 那 么 ， 应 用 提前 z 测 试 所 得 到 的 优化 效果 将 是 可 想 而 知 的 。 
我 们 不 能 通过 Direct3D API 来 控制 提前 z 测 试 ， 而 负责 该 功能 的 往往 是 图 
形 驱 动 。 例 如 ， 寿 像 系 着 色 妖 将 修改 像素 片段 的 深度 值 ， 那 么 便 不 能 i 
行 提前 z 测 试 。 这 是 因为 倘若 像素 着 色 器 修改 了 深度 值 ， 那 么 可 能 会 对 
深度 测试 造成 影响 。 所 以 ， 在 这 种 情况 下 ， 像 素 着 色 器 必须 在 深度 测试 
之 前 执行 。 











注 意 Note ~ 








前 面 提 到 ， 在 像素 着 色 器 中 能 修改 像素 的 深度 值 。 但 是 该 怎样 来 实 
现 这 种 操作 呢 ? 正如 我 们 目前 所 做 的 ， 像 素 着 色 需 不 仅 能 输出 单个 颜色 
器 量 ， 还 能 输出 结构 体 : 


struct PixelOut 
float4 color : SV_Target; 
float depth : SV_Depth; 
}; 
PixelOut PS(VertexOut pin) 


PixelOut pout; 

















// 常规 的 像素 相关 处 理 





pout.Color = float4(litColor, alpha); 


// 把 像素 深度 值 设置 在 归 一 化 范围 [6，1] 内 
pout .depth = pin.PosH.z - 6.65f; 


return pout; 





SV te sh deat eed 
深度 值 。 通 过 使 用 特殊 的 系统 值 语义 SV_Depth， 便 可 以 使 像素 着 色 器 
输出 经 过 修改 的 深度 值 。 


9. 另 一 种 实现 深度 复杂 性 可 视 化 的 方式 是 使 用 加 法 混合 技术 。 首 
先 清 理 后 台 缓 冲 区 ， 使 之 为 黑色 ， 并 禁用 深度 测试 。 其 次 ， 设 源 混合 因 
子 与 目标 混合 因子 都 为 D3D12_BLEND_ONE， 再 将 混合 运算 方法 置 
为 D3D12_BLEND_OP_ADD， 使 混合 公式 变 为 C = Csrc + Cust。 观 察 此 公 





式 可 知 ， 针 对 每 个 像素 ， 我 们 将 其 所 有 像素 片段 的 颜色 都 累加 在 一 起 并 
回 写 。 最 后 ， 再 用 像素 着 色 器 以 类 似 于 (0.05, 0.05, 0.05) 这 种 低 强 度 的 颜 
色 和 输出 方式 来 泻 染 场景 中 的 所 有 物体 。 像 素 重 新 绘制 的 次 数 越 多 ， 这 种 
低 强 上 度 颜色 也 融 累 加 得 越 多 ， 对 应 像素 就 全 发 明亮 。 例 如 ， 奋 某 像 孙 补 
重复 绘制 了 10 次 ， 则 该 像素 的 颜色 强度 将 变 为 (0.5, 0.5, 0.5)。 这 样 一 
来 ， 在 场景 泻 染 完 成 之 后 ， 我 们 通过 观察 像素 的 颜色 强度 便 可 了 解 场景 
中 深度 复杂 性 的 分 布 情况 。 请 用 第 10 章 中 的 “Blend Demo” 演 示 程 序 作为 
测试 场景 ， 并 以 上 述 方式 来 测试 其 深度 复杂 性 。 











10. 哲 述 如 何 来 统计 深度 测试 成 功 的 像 系数 量 。 再 阐明 怎样 才能 计 
算出 深度 测试 失败 的 像素 数量 。 


11. 修改 “Stencil Demo” 演 示 程 序 ， 把 地 板 与 船 仍 头 都 映 〈 反 ) 射 
到 镜子 当中 。 


12， 从 泻 染 项 阴影 的 世界 矩阵 中 移 除 垂直 方 辐 上 :坐标 〉 的 偏 移 
量 ， 以 便 观察 深度 冲突 。 





[1] 在 预览 版 中 ， 枚 举 类 型 D3D12_COMPARISON_FUNC 中 成 员 的 定义 都 
形 如 D3D12_COMPARISON_ XOX0。 


[2] 两 者 在 同一 平面 时 ， 会 相互 打架 fighting) ， 争 夺 在 > 轴 上 的 高 
度 ， 也 束 是 显示 权 (高 的 就 能 抢 错 露 脸 ) 。 你 死 我 活 之 际 ， 显 示 权 反复 
易 主 ， 从 而 互 有 显示 的 时 段 ， 造 成 内 烁 的 效果 。 











[3] 位 于 本 书 DirectX 11 版 第 10 间 的 BoltAnim 文 件 夹 中 。 


第 12 章 ”几何 着 色 需 


如 果 不 启 用 曲面 细 分 〈tessellation ) 这 一 环节 ， 那 么 几何 着 色 器 
(geometry shader) 这 个 可 选 阶段 便 会 位 于 顶点 着 色 器 与 像素 着 色 器 之 
间 。 顶 点 着 色 器 以 顶点 作为 输入 数据 ， 而 几何 着 色 器 的 输入 数据 则 是 完 
整 的 图 元 。 例 如 ， 如 果 要 绘制 三 角形 列表 (triangle list) ， 则 几何 着 色 

妖 程 序 实际 将 对 列表 中 的 每 个 三 角形 T 执 行 下 列 操作 : 











for(UINT i = 6; i < numTriangles; ++i) 


OutputpPrimitiveList = GeometryShader( T[i].vertexList ); 





可 以 注意 到 ， 几 何 着 色 器 以 每 个 三 角形 的 3 个 顶点 作为 输入 ， 且 输 
出 的 是 对 应 的 图 元 列表 。 与 顶点 着 色 峰 不 能 销毁 或 创建 项 点 不 同 ， 几 何 
独 色 需 的 亮点 便 是 可 以 创建 或 销毁 几何 图 形 ， 此 功能 使 GPU 实现 一 些 有 
趣 的 效果 成 为 可 能 。 比 如 说 ， 借 助 几 何 着 色 器 可 以 将 输入 的 图 元 扩展 为 
一 个 或 更 多 其 他 类 型 的 图 元 ， 或 者 能 根据 茶 些 条 件 而 选择 不 输出 图 元 。 
注意 ， 儿 何 着 色 器 的 输出 图 元 类 型 不 一 定 与 输入 图 元 的 类 型 相同 。 例 
如 ， 几 何 看 色 器 的 一 个 第 见 拿 手 好 戏 即 是 将 一 个 点 扩展 为 一 个 四 边 形 
《 即 两 个 三 角形 ) 。 





几何 着 色 右 所 输出 的 图 元 由 顶点 列表 定义 而 成 。 在 退出 几何 着 色 器 
时 ， 必 将 项 点 的 位 置 变 换 到 齐 次 裁 蚤 空间 。 换 言 之 ， 经 过 几何 着 色 右 阶 
段 的 处 理 后 ， 我 们 就 得 到 了 位 于 齐 次 妨 允 空间 中 由 一 系列 顶 扣 所 定义 的 
多 个 图 元 。 这 些 顶 点 会 同样 历经 投影 〈 齐 次 除法 ) 与 光栅 化 等 后 续 步 





学 习 目标 ; 








1. 学 习 如 何 编写 几何 着 色 器 。 


2. 探究 如 何 通过 几何 着 色 器 来 高 效 地 实现 公告 牌 技术 
(billboard) 。 


3. 了解 目 动 生成 图 元 ID 及 其 相关 的 应 用 。 
4. 研究 如 何 创建 和 使 用 纹理 数组 ， 并 认识 到 它们 为 何如 此 实用 。 


5. 理解 如 何 运 用 alpha-to-coverage 技 术 来 辅助 解决 alpha 裁 前 〈alpha 
cutout) 的 失真 问题 。 


12.1 编写 几何 着 色 器 


儿 何 着 色 占 的 编写 方式 比较 接近 于 顶点 着 色 器 和 像素 着 色 右 ， 当 然 
也 存在 夺 干 区 别 。 下 列 代码 展示 了 几何 看 色 占 的 一 般 编写 格式 : 





[maxvertexcount(N)] 
void ShaderName ( 
PrimitiveType InputVertexType InputName[NumElements], 


inout StreamOutputObject<OutputVertexType> OutputName) 





// 几何 着 色 器 的 具体 实现 








我 们 必须 先 指 定 几何 着色 絮 单 次 调用 所 输出 的 项 点 数量 最 大 值 〈 每 
个 图 元 都 会 调用 一 次 几何 着 色 器 ， 走 一 饥 其 中 的 处 理 流 程 ) 。 对 此 ， 可 
以 使 用 下 列 属 性 语法 来 设置 着 色 器 定义 之 前 的 最 大 顶点 数量 : 


[maxvertexcount(N) ] 


其 中 ，N 是 几何 着 色 器 单 次 调用 所 输出 的 顶点 数量 最 大 值 。 几 何 着 
色 器 每 次 输出 的 顶点 个 数 都 可 能 各 不 相同 ， 但 是 这 个 数量 却 不 能 超过 之 
前 定义 的 最 大 值 。 出 于 对 性 能 方面 的 考量 ， 我 们 应 当 令 
maxvertexcount 的 值 尽 可 能 地 小 。 相 关 资 料 显示 [NVIDIA08]， 在 
GS【〔 即 几何 着 色 器 的 缩写 ，geometry shader) 每 次 输出 的 标量 数量 在 1 
一 20 时 ， 它 将 发 挥 出 最 佳 的 性 能 ， 而 当 GS 每 次 输出 的 标量 数量 保持 在 
27 一 40 时 ， 它 的 性 能 将 下 降 到 峰值 性 能 的 50%。 每 次 调用 几何 着 色 器 所 
输出 的 标量 个 数 为 : maxvertexcount 与 输出 顶点 类 型 结构 体 中 标量 个 
数 的 乘积 由。 在 实践 中 完全 满足 这 些 限 制 是 比较 困难 的 ， 所 以 我 们 或 取 











比 最 佳 性 能 稍 差 的 解决 方案 ， 或 干脆 选择 男 一 种 与 几何 着 色 器 无 关 的 实 
现 方 法 。 当 然 ， 这 里 一 定 也 要 考虑 到 其 他 方法 所 带 来 的 兹 端 一 一 也 许 还 
不 如 直接 用 几何 着 色 器 来 实现 给 力 。 再 者 ， 从 2008 年 [INVIDIA08] (第 
一 代 几 何 着 色 器 ) 至 今 ， 几 何 着 色 器 的 相关 方面 也 有 了 不 少 的 改良 。 








几何 着 色 器 有 输入 、 输 出 共 两 个 参数 (实际 上 它 可 以 拥有 更 多 的 参 
数 ， 但 这 又 是 妨 一 个 主题 了 ， 具 体内 容 参见 12.2.4 节 ) 。 输 入 参数 必须 
是 一 个 定义 有 特定 图 元 的 顶点 数组 一 一 点 应 输入 一 个 顶点 、 线 条 要 输入 
两 个 顶点 、 三 角形 需 输入 3 个 顶点 、 线 及 其 邻接 图 元 为 4 个 顶点 、 三 角形 
及 其 邻接 图 元 则 为 6 个 项 点。 几何 着 色 器 的 输入 顶点 类 型 即 为 顶点 着 色 
器 输出 的 顶点 类 型 〈 例 如 Vertexout) 。 输 入 参数 一 定 要 以 图 元 类 型 作 
为 前 经 ， 用 以 摘 述 输入 到 几何 着 色 器 的 具体 图 元 类 型 。 该 前 级 可 以 是 下 
列 类 型 之 一 : 


1. point: 输入 的 图 元 为 点 。 
2. line: 输入 的 图 元 为 线 列 表 或 线条 各 。 
3. triangle: 输入 的 图 元 为 三 角形 列表 或 三 角形 带 。 


4. lineadj: 输入 的 图 元 为 线 列 表 及 其 邻接 图 元 ， 或 线条 带 及 其 
邻接 图 元 。 


5. triangleadj: 输入 的 图 元 为 三 角形 列表 及 其 邻接 图 元 ， 或 三 
角形 带 及 其 邻接 图 元 。 


向 几何 着 色 器 输入 的 数据 必须 是 完整 的 图 元 《〈 例 如 组 成 线条 的 两 个 
顶点 、 构 成 三 角形 的 3 个 顶点 等 ) 。 因 此 ， 几 何 着 色 器 并 不 会 区 分 输入 
的 图 元 究竟 是 列表 结构 〈list) 还 是 融 状 结构 〈strip) 。 举 个 例子 ， 知 绘 
制 的 图 元 实际 上 是 三 角形 帝 ， 但 几何 着 色 器 仍 会 把 三 角形 帝 视 作 多 个 三 
角形 并 分 别 进行 单独 的 处 理 ， 即 将 每 个 三 角形 的 3 个 顶点 作为 其 输入 数 
据 。 绘 制 融 状 结构 的 过 程 中 会 产生 额外 的 开销 ， 因 为 多 个 图 元 所 共用 的 
顶点 在 几何 着 色 器 中 会 被 处 理 多 次 。 








输出 参数 一 定 要 标 有 inout 修 饰 行 。 男 外 ， 它 必须 是 一 种 流 类 型 
(stream type。 即 某 种 类 型 的 流 输 出 对 象 ) 。 流 类 型 存 有 一 系列 项 点， 
它们 定义 了 几何 着 色 器 输出 的 几何 图 形 。 几 何 着 色 器 可 以 通过 内 置 方法 
Append 回 输出 流 列 表 添 加 单个 顶点 : 


void StreamOutputObject<OutputVertexType>::Append(OutputVertexType v); 


流 类 型 本 质 上 是 一 种 模板 类 型 (template type) ， 其 模板 参数 用 以 
指定 输出 顶点 的 具体 类 型 (如 Geo0ut) 。 流 类 型 有 如 下 3 种 。 





1. PointSstream<OutputVertexType>: 一 系列 顶点 所 定义 的 点 
列表 。 


2. Linestream<OutputVertexType>: 一 系列 顶点 所 定义 的 线条 


3. TriangleSstream<OutputVertexType>: 一 系列 顶点 所 定义 的 


三 角形 带 。 


几何 着 色 吉 输出 的 多 个 顶点 会 构成 图 元 ， 图 元 的 输出 类 型 由 流 类 型 
( 即 PointSstream、LineSstream 与 TriangleStream) 来 指定 。 对 于 
线条 与 三 角形 来 说 ， 几 何 着 色 器 输出 的 对 应 图 元 必定 是 线条 于 与 三 角形 
人 带 。 而 线条 列表 与 三 角形 列表 可 借助 内 置 函数 RestartSstrip 来 实现 : 


void StreamOutputObject<OutputVertexType>: :RestartSstrip(); 


比如 ， 如 果 希 望 输出 三 角形 列表 ， 则 需要 在 每 次 向 输出 流 奶 加 3 个 
顶点 之 后 调用 RestartStripl?l。 





以 下 是 一 些 几何 着色 器 签 名 的 具体 用 例 。 











// 示例 1: GS 最 多 输出 4 个 顶点 。 输 入 的 图 元 一 根 是 线条 ， 输 出 的 是 一 个 三 角形 带 
[maxvertexcount(4)] 
void GS(line VertexOut gin[2], 

inout TriangleStream<GeoOut> tristream) 








// 儿 何 着 色 器 的 具体 实现 ...... 





} 
// 
// 不 例 2: GSs 最 多 输出 32 个 顶点 。 输 入 的 图 元 是 一 个 三 角形 ， 输 出 的 是 一 个 三 角形 市 
// 
[maxvertexcount(32)] 
void GS(triangle VertexOut gin[3], 
inout TriangleStream<GeoOut> tristream) 














// 几何 着 色 器 的 具体 实现 ...... 





// 示例 3: GS 人 至 多 输出 4 个 顶点 。 输 入 的 图 元 是 一 个 点 ， 输 出 的 是 一 个 三 角形 禹 
// 
[maxvertexcount(4)] 
void GS(point VertexOut gin[1], 
inout TriangleStream<GeoOut> tristream) 














// 几何 着 色 器 的 主体 . . . 








下 列 几何 着 色 器 详细 地 展示 了 Append 与 RestartStrip 方 法 的 调用 
过 程 。 此 示例 会 将 输入 的 三 角形 进行 细 分 〈 见 图 12.1) ， 并 输出 细 分 后 
的 4 个 小 三 角形 : 


hi 





Po D; D2 


图 12.1 将 三 角形 细 分 为 大 小 相等 的 4 个 小 三 角形 。 通 过 观察 可 以 发 现 ， 新 添加 的 3 个 顶点 均 位 
于 原 三 角形 边 上 的 中 点 




















struct VertexOut 


{ 
float3 PosL : POSITION; 
float3 NormalL : NORMAL ; 
float2 Tex : TEXCOORD; 

}; 

struct GeoOut 

{ 
float4 PosH : SV_POSITION; 
float3 PosW : POSITION; 
float3 NormalW : NORMAL; 
float2 Tex : TEXCOORD; 
float FogLerp : FOG; 

}; 


void Subdivide(VertexOut inVerts[3], out VertexOut outVerts[6]) 


VertexOut m[3]; 





// 计算 三 角形 边 上 的 中 点 

m[6].PosL = 8.5f*(inVerts[8].PosL+inVerts[1].PosL); 
m[1].PosL = 8.5f*(inVerts[1].PosL+inVerts[2].PosL); 
m[2].PosL = 68.5f*(inVerts[2].PosL+inVerts[06].PosL); 











// 把 项 点 投影 到 单位 球面 上 
m[6].PosL = normalize(m[8].PosL); 
m[1].PosL = normalize(m[1].PosL); 
m[2].PosL = normalize(m[2].PosL); 




















// 求 出 法 线 

m[8] .NormallL = m[8].PosL; 
m[1].NormalL = m[1].PosL; 
m[2] .NormallL = m[2].PosL; 



































// 对 纹理 坐标 进行 插值 
m[6].Tex = 6.5f*(inVerts[8].Tex+inVerts[1].Tex); 
m[1].Tex = 86.5f*(inVerts[1].Tex+inVerts[2].Tex); 
m[2].Tex = 8.5f*(inVerts[2].Text+inVerts[08].Tex); 











outVverts[6] = inVerts[0]; 
outVerts[1] = m[6]; 
outVerts[2] = m[2]; 
outVerts[3] = m[1]; 
outVerts[4] = inVerts[2]; 
outVerts[5] = inVerts[1]; 


}; 


void OutputSubdivision(VertexOut v[6], 
inout TriangleStream<GeoOut> triStream) 


{ 
GeoOut gout[6]; 


[unroll] 
for(int i = 6; i < 6; ++i) 





// 将 顶点 变换 到 世界 空间 
gout[i].PosW = mul(float4(v[i].PosL, 1.6f), gWorld).xyz; 
gout[i].NormalW = mul(v[i].NormalL, (float3x3)gWorldInvTranspose); 





// 把 顶点 变换 到 齐 次 裁剪 空间 
gout[i].PosH = mul(float4(v[i].PosL，1.6f)，gWorldviewProj ); 
gout[i]l.Tex = v[i].Tex; 


// 我 们 可 以 将 细 分 的 小 三 角形 绘制 到 两 个 三 角形 带 中 去 : 
// 三 角形 带 1: 底 端 的 3 个 三 角形 
// Ey; 形 和 带 2: 内 顶部 的 三 角形 












































[unroll] 
for(int j = 6j j < 5; ++j) 


tristream.Append(gout[j]); 


} 
triStream.RestartStrip(); 


tristream.Append(gout[1]); 

tristream.Append(gout[5]); 

tristream.Append(gout[3]); 
} 


[maxvertexcount(8)] 
void GS(triangle VertexOut gin[3], inout TriangleStream<GeoOut>) 


{ 


VertexOut v[6]; 
Subdivide(gin, v); 
OutputSubdivision(v, triStream); 








几何 着 色 器 的 编译 过 程 也 与 顶点 着 色 器 和 像素 着 色 器 如 出 一 办 。 如 


果 TreeSprite.nls] 文 件 中 有 名 为 Gs 的 几何 着 色 堪 ， 则 可 以 用 下 列 方法 将 其 
编译 为 字 市 码 : 


mShaders["treeSpriteGS"] = d3dUtil::CompileShader( 





L"Shaders\\TreeSprite.hlsl", nullptr, "GS", "gs 5 0"); 


就 像 顶 点 着 色 器 与 像素 着 色 器 一 样 ， 要 将 指定 的 几何 着 色 器 作为 流 
水 线 状态 对 象 (pipeline state object，PSO ) 的 一 部 分 ， 以 此 将 它 绑 定 到 
泻 染 流水 线 上 : 


D3D12 _ GRAPHICS PIPELINE STATE DESC treeSpritePsoDesc = opaquePsoDesc ; 


treeSpritePsoDesc.GS = 


{ 


reinterpret cast<BYTE*>(mShaders["treeSpriteGS"]->GetBufferPpointer()), 
mShaders["treeSpriteGS"]->GetBufferSize() 


}; 





注音 Note > 


寿 给 出 一 个 输入 图 元 ， 几 何 着 色 咒 也 可 以 根据 某 些 条 件 而 选择 不 输 
出 任何 数据 。 通 过 这 种 方式 ， 几 何 着 色 便 可 以 轻易 地 “销毁 ”几何 图 形 ， 
这 对 于 一 些 算法 的 实现 来 讲 是 很 有 帮助 的 。 














如 果 没 有 回 几 何 着 色 器 输入 组 装 完 整 图 元 所 需 的 足够 项 点， 将 会 导 
致 部 分 图 元 的 遗失 中。 


12.2 ”以 公告 牌 技术 实现 森林 效果 


12.2.1 概述 





当 树 与 树 之 间 的 距离 较 远 时 ， 残 轮 到 公告 秩 billboard， 也 称 公 告 
板 等 ) 技术 大 显 神威 了 ， 即 以 绘 有 3D 树 木 图 片 的 四 边 形 来 普 代 对 整 株 
3D 树 的 泻 染 〈 见 图 12.2) 。 从 远 处 看 去 ， 公 告 牌 技术 往往 并 不 会 露出 破 
绽 。 这 里 还 有 一 个 小 秘诀 ， 惑 是 使 公告 牌 总 是 面 问 摄像 机 《否则 很 容易 


露馅 儿 ) 多。 





RGB 通道 alpha 通 道 




















图 12.2 ”一 颗 树木 公告 牌 纹理 及 其 alpha 通 道 














假设 y 币 指向 正 上 方 ， 且 平面 z: 表 示 地 面 ， 则 树木 公告 牌 通常 被 置 
于 zz: 平面 内 并 与 9 和 对 章 而 面向 摄像 机 。 图 12.3 以 鸟 辐 视角 展示 了 几 个 公 
告 牌 的 局 部 坐标 系 -可 以 看 出 ， 所 有 的 公告 牌 都 正在 面 对 着 摄像 机 揪 
首 弄 姿 地 “ 抢 镜 ”。 











在 世界 空间 中 ， 知 给 定 一 公告 牌 的 中 心 位 置 〈 也 就 是 四 边 形 的 中 心 


点 ) 为 C = (Cr, cy C:)， 而 摄像 机 的 位 置 为 已 = (如 y,:)， 那 么 ， 这 些 
诗 息 就 足以 表示 出 该 公告 牌 局 部 坐标 系 与 世界 空间 的 相对 关系 : 


(Br — C7,0,E.—C.) 
~ |B — Cz,0,E.—C.| 


XU 


一 (0. 1. 0) 





图 12.3” 面 对 摄像 机 的 众 公告 牌 








给 出 公告 牌 局 部 坐标 系 与 世界 空间 的 相对 关系 以 及 公告 牌 的 在 世界 
空间 中 的 大 小 〈world size) ， 我 们 就 能 以 下 列 代 码 来 获得 公告 牌 四 边 形 
的 4 个 顶点 坐标 〈 见 图 12.4) : 


float4(gin[6].CenterW + halfWidth*right halfHeight*up, 
float4(gin[6].CenterW + halfWidth*right halfHeight*up, 


float4(gin[6].CenterW - halfWidth*right halfHeight*up, 
float4(gin[6].CenterW - halfWidth*right halfHeight*up, 





注意 ， 由 于 公告 牌 彼此 之 间 的 局 部 坐标 系 并 不 一 至， 所 以 每 一 个 公 
告 脾 的 四 边 形 都 要 分 别 计 算 。 



































图 12.4 根据 公告 牌 的 局 部 坐标 系 及 其 位 于 世界 空间 中 的 大 小 来 计算 公告 牌 四 边 形 的 顶点 


对 于 眼下 这 个 演示 程序 而 言 ， 我 们 将 构造 一 系列 距 陆地 表面 有 着 特 
定 距离 的 点 图 元 (将 PSO 中 的 PrimitiveTopologyType 成 员 指定 
为 D3D12_PRIMITIVE TOPOLOGY_TYPE_POINT， 并 把 
ID3D12GraphicsCommandList::IASsetPrimitiveTopology 函 数 的 参 
数 指定 为 D3D_PRIMITIVE_TOPOLOGY_POINTLIST) 。 这 些 点 表示 的 就 
是 我 们 希望 绘制 的 公告 牌 的 中 心 点 。 在 几何 着 色 器 中 ， 我 们 既 要 把 这 些 
点 扩展 为 公告 牌 的 四 边 形 ， 又 要 计算 公告 牌 的 世界 年 阵 。 图 12.5 所 示 的 
就 是 该 演示 程序 的 效果 。 





9 D3010 ApFlicas 


FPS: 524 
Milliseconcs: Per Frame: 1.9084 








图 12.5 ”树木 公告 牌 例 程 的 效果 图 





从 图 12.5 中 也 能 看 出 ， 这 个 示例 源 于 第 10 章 中 的 “Blend Demo” 演 示 


一 种 通过 CPU 来 实现 公告 牌 技术 的 常用 方法 是 ， 在 动态 顶点 缓冲 区 
〈 即 上 传 堆 ) 中 来 控制 每 个 公告 牌 的 4 个 顶点 。 每 当 摄像 机 移动 时 ， 这 
些 顶点 都 会 经 CPU 重新 计算 而 随 之 更 新 ， 再 通过 memcpy 函 数 将 其 复制 
到 GPU 端的 缓冲 区 ， 以 此 令 公告 牌 保持 面 对 摄 像 机 。 知 使 用 此 方法 ， 就 
一 定 要 将 每 个 公告 牌 的 4 个 顶点 都 提交 到 IA (Input Assembler， 输 入 装配 
器 ) 阶段 ， 并 且 还 需 更 新 动态 顶点 缓冲 区 ， 这 会 产生 一 定 的 开销 。 若 采 
用 几何 着 色 器 来 实现 公告 牌 技术 ， 我 们 就 能 从 容 运用 静态 的 顶点 绥 冲 
区 ， 这 是 因为 单 赁 几何 着 色 器 即 可 扩展 公告 牌 的 四 边 形 ， 并 令 公告 牌 面 





对 摄像 机 。 另 外 ， 几 何 着 色 器 方案 中 公告 牌 所 占用 的 内 存 空间 也 极 小 ， 
因为 创建 每 个 公告 脾 只 需 向 IA 阶 段 提交 一 个 顶点 即 可 。 


12.2.2 ”顶点 结构 体 





我 们 用 以 下 顶 扣 结构 体 来 插 述 公告 牌 : 


struct TreeSpriteVertex 


XMFLOAT3 Pos ; 
XMFLOAT2 Size; 


3 


mTreeSpriteInputLayout = 


{ "POSITION", 0, DXGI FORMAT R32G32B32 FLOAT, 
D3D12 INPUT CLASSIFICATION PER VERTEX DATA, 
{ "SIZE", ©, DXGI FORMAT R32G32 FLOAT, 6，12, 
D3D12_INPUT_CLASSIFICATION_PER_VERTEX_DATA， 








顶点 结构 体 中 所 存储 的 点 即 表示 在 世界 空间 内 公告 牌 的 中 心 位 置 。 
除 此 之 外 ， 它 还 包含 一 个 存 有 公告 牌 宽 度 / 蜗 度 的 数据 成 员 ， 以 表示 其 
大 小 《已 按 世 界 空间 的 单位 进行 缩放 ) 。 因 此 ， 几 何 着 色 器 便 能 知晓 打 - 
展 后 的 公告 牌 会 有 多 大 〈 见 图 12.6) 。 通 过 调整 每 个 顶点 结构 体 中 表示 
大 小 的 成 员 ， 我 们 残 可 以 方便 地 构造 出 不 同 尺寸 的 公告 牌 。 








除了 纹理 数组 〈12.3 节 ) 以 外 , “Tree Billboards” 演 示 程 序 中 的 其 他 
C++ 代码 部 分 都 已 有 了 有 具体 的 Direct3D 编 码 实 现 《〈 即 创建 顶点 缓冲 区 、 
效果 文件 9 与 调用 绘制 方法 等 功能 ) 。 这 样 一 来 ， 我 们 只 需 将 注意 力 转 


移 到 TreeSprite.hls] 文 件 上 即 可 。 


高 度 





宽度 


图 12.6 将 一 个 点 扩展 为 一 个 四 边 形 


12.2.3 HLSL 文 件 





由 于 这 是 本 书 第 一 次 向 读者 展示 儿 何 着 色 器 示例 ， 所 以 我 们 将 在 此 
列 出 完整 的 HLSL 人 代码， 使 读者 便于 了 解 几 何 着 色 器 、 顶 点 着 色 器 和 像 
素 着 色 器 这 三 者 的 搭配 使 用 方法 。 该 效果 文件 也 引入 了 一 些 之 前 未 曾 讨 
论 过 新 对 象 《SV_PrimitiveID 与 Texture2DArray) ， 在 后 续 小 节 里 
会 依次 对 此 进行 介绍 。 眼 下 ， 我 们 主要 关注 的 是 几何 着 色 器 程序 Gs。 正 
如 12.2.1 节 中 所 述 ， 该 着 色 器 的 功能 是 把 一 个 点 扩展 为 一 个 四 边 形 ， 并 
使 之 与 y 轴 对 齐 以 正 对 摄像 机 。 








yO ed te A ot A 
炒米 炒米 


// TreeSprite.hls1 的 作者 为 Frank Luna (C) 2615 版 权 所 有 





VA Mi ht dt tt dtd tt 
米 米 炒米 


// 光源 数量 的 默认 值 
#ifndef NUM_DIR_LIGHTS 

#define NUM DIR LIGHTS 3 
#endif 





#ifndef NUM POINT_ LIGHTS 
#define NUM POINT_ LIGHTS 6 
#endif 


#ifndef NUM SPOT_LIGHTS 
#define NUM SPOT_LIGHTS 6 
#endif 











// 包含 光照 所 需 的 结构 体 与 函数 
#include "LightingUtil.hlsl" 


Texture2DArray gTreeMapArray : register(tQ); 


SamplerState gsamPpointWrap : register(sQ); 
SamplerState gsamPointClamp : register(s1); 
SamplerState gsamLinearWrap : register(s2); 
SamplerState gsamLinearClamp : register(s3); 


SamplerState gsamAnisotropicWrap : register(s4); 
SamplerState gsamAnisotropicClamp : register(s5); 








// 每 一 帧 都 在 变化 的 常量 数据 
cbuffer cbPerObject : register(b6) 
{ 

float4x4 gWorld; 

float4x4 gTexTransform; 


}; 


// 绘制 过 程 中 所 用 的 杂项 常量 数据 
cbuffer cbPass : register(b1) 
{ 
float4x4 gView; 
float4x4 gInvView; 
float4x4 gProj; 
float4x4 gInvProj; 
float4x4 gViewProj; 
float4x4 gInvViewProj; 
float3 gEyePoskW; 
float cbPerObjectPad1; 
float2 gRenderTargetSize; 
float2 gInvRenderTargetSize; 

















float gNearZ 

float gFarz; 

float gTotalTime; 
float gDeltaTime; 
float4 gAmbientLight; 


float4 gFogColor; 
float gFogStart; 
float gFogRange; 
float2 cbPperObjectPad2; 


// 对 于 每 个 以 MaxLights 为 光源 数量 最 大 值 的 对 象 来 说 ， 索 引 [@,NUM_DIR_LIGHTS) 表 示 
的 是 方向 光 

// 源 ， 索 引 [NUM_DIR_LIGHTS，NUM_DIR_LIGHTS+NUM_POINT_LIGHTS] 表 示 的 是 点 光源 
// 索引 [NUM_DIR_LIGHTS+NUM_POINT_LIGHTS，NUM_DIR_LIGHTS+NUM_POINT_LIGHT+ 
// NUM_SPOT_LIGHTS) 表 示 的 则 为 聚光灯 光源 

Light gLights[MaxLights]; 
}; 


// 每 种 材质 都 各 有 区 别 的 常量 数据 
cbuffer cbMaterial : register(b2) 
{ 

float4 gDiffuseAlbedo; 

float3 gFresnelRe; 

float gRoughness; 

float4x4 gMatTransform; 


}; 

















struct VertexIn 

{ 
float3 PosW : POSITION; 
float2 SizeW : SIZE; 


}; 


struct VertexOut 

{ 
float3 CenterW : POSITION; 
float2 SizeW : SIZE; 


}; 


struct GeoOut 

{ 
float4 PosH : SV_POSITION; 
float3 PosW : POSITION; 
float3 NormalW : NORMAL; 
float2 TexC : TEXCOORD; 
uint PrimID : SV_PrimitiveID; 


}; 


VertexOut VS(VertexIn vin) 
{ 


VertexOut vout; 





// 直接 将 数据 传 入 几何 着 色 器 
vout.CenterW = Vin.PosW; 
vout.SizeW = Vin.SizeW; 








return vout; 


} 


// 由 于 我 们 要 将 每 个 点 都 扩展 为 一 个 四 边 形 〈 即 4 个 顶点 ) ， 因 此 每 次 调用 几何 着 色 器 最 多 
输出 4 个 顶点 
[maxvertexcount(4)] 
void GS(point VertexOut gin[1], 
uint primID : SV_PrimitiveID， 
inout TriangleStream<GeoOut> tristream) 








// 
// 计算 精灵 [5] 的 局 部 坐标 系 与 世界 空间 的 相对 关系 ， 以 使 公告 牌 与 y 轴 对 齐 且 面向 观察 者 
// 


























float3 up = float3(6.6f, 1.6f, 8.6f); 

float3 look = gEyePosW - gin[6].CenterW; 

look.y = 6.6f;j // 与 y 轴 对 齐 ， 以 此 使 公告 牌 并 于 xz 平 面 
look = normalize(look); 

float3 right = cross(up, look); 
































// 
// 计算 世界 空间 中 三 角形 带 的 顶点 《〈 即 四 边 形 ) 
// 


float halfNidth = 6.5f*gin[8].SizeW.x; 
float halfHeight = 6.5f*gin[8].SizeW.y; 


float4 v[4]; 

v[6] = float4(gin[6].CenterN + halfWidth*right - halfHeight*up, 1.6f); 
v[1] = float4(gin[6].CenterW + halfWidth*right + halfHeight*up, 1.6f); 
v[2] = float4(gin[6].CenterW - halfWidth*right - halfHeight*up, 1.6f); 
v[3] = float4(gin[6].CenterW - halfWidth*right + halfHeight*up, 1.6f); 














// 
// 将 四 边 形 的 顶点 变换 到 世界 空间 ， 并 将 它们 以 三 角形 带 的 形式 输出 
// 


float2 texC[4] = 


{ 
float2(86.9f，1.6f)， 
float2(86.9f，6.6f)， 
float2(1.9f，1.6f)， 
float2(1.9f，6.6f) 


}; 

GeoOut gout; 

[unroll] 

for(int i = 606; i < 4; ++i) 

{ 
gout.PosH = mul(v[i], gViewpProj); 
gout.PosW = v[i].xyz; 
gout.NormalW = look; 
gout.TexC = texC[i]; 


gout.PrimID = primID; 


tristream.Append(gout); 


} 
} 


float4 PS(GeoOut pin) : SV_Target 
{ 
float3 uvw = float3(pin.TexC, pin.PrimID%3); 
float4 diffuseAlbedo = gTreeMapArray.Sample( 
gsamAnisotropicWrap, uvw) * gDiffuseAlbedo; 


#ifdef ALPHA _ TEST 

// 忽略 纹理 alpha 值 《 86.1 的 像素 。 这 个 测试 要 尽早 完成 ， 以 便 提前 退出 着 色 器 ， 使 满足 
此 条 件 的 像素 

// 跳 过 着 色 器 中 不 必要 的 后 续 处 理 流程 

clip(diffuseAlbedo.a - 6.1f); 
#endif 




































































// 对 法 线 插值 可 能 导致 其 非 规 范 化 ， 因 此 需 再 次 对 它 进行 规范 化 处 理 


pin.NormalN = normalize(pin.NormalW); 























// 光线 经 表面 上 一 点 反射 到 观察 点 这 一 方向 上 的 向 量 
float3 toEyeW = gEyePosW - pin.PosW; 

float distToEye = length(toEyelW); 

toEyeW /= distToEye; // 规范 化 处 理 
































T 


// 光照 项 
float4 ambient = gAmbientLight*diffuseAlbedo; 


const float shininess = 1.6f - gRoughness; 
Material mat = { diffuseAlbedo, gFresnelR@, shininess }; 


float3 shadowFactor = 1.6f; 
float4 directLight = ComputeLighting(gLights, mat, pin.PosW, 
pin.NormalW, toEyeW, shadowFactor); 


float4 litColor = ambient + directLight; 


#ifdef FOG 
float fogAmount = saturate((distToEye - gFogStart) / gFogRange); 
litColor = lerp(litColor, gFogColor, fogAmount); 

#endif 





// 从 漫 射 反照 率 中 获取 alpha 值 的 常用 手段 
litColor.a = diffuseAlbedo.a; 


return litColor; 


} 





12.2.4 SV_PrimitiveID 语 义 





在 以 上 示例 中 ， 几 何 厦 色 器 内 含有 一 个 使 用 SV_PrimitiveID 语 义 
的 特殊 无 符号 整数 参数 。 


[maxvertexcount(4)] 
void GS(point VertexOut gin[1], 


uint primID:SV_PrimitiveID, 
inout TriangleStream<GeoOut> tristream) 





右 指 定 了 该 语义 ， 则 输入 装配 器 阶段 会 目 动 为 每 个 图 元 生成 图 元 
ID。 在 绘制 2 个 图 元 的 调用 执行 过 程 中 ， 第 一 个 图 元 被 标记 为 0， 第 二 个 
图 元 被 标识 为 1， 并 以 此 类 推 ， 直 到 此 绘制 调用 过 程 中 最 后 一 个 图 元 被 
标记 为 n 一 1 为 止 。 对 于 单 次 绘制 调用 来 说 ， 其 中 的 图 元 ID 痢 是 唯一 的 。 
在 公告 脾 示 例 中 ， 几 何 着 色 占 不 会 用 到 此 ID (尽管 它 可 以 使 用 ) ， 它 仪 
将 图 元 ID 写 入 到 输出 的 顶点 之 中 ， 以 此 将 它们 传递 到 像素 着 色 右 阶段 。 
而 像 际 着色 需 则 把 图 元 ID 用 作 纹 理 数组 的 索引 ， 这 是 下 一 小 节 将 讲述 的 


如 果 代 码 中 不 存在 几何 着 色 器 ， 我 们 便 可 以 将 图 元 ID 参数 加 入 像素 
独 色 器 的 参数 列表 : 


float4 PS(VertexOut pin, uint primID : SV_PrimitiveID) : SV_Target 


{ 
// 像素 着 色 器 的 具体 实现 








但 是 ， 若 代码 内 具有 几何 着 色 器 ， 则 图 元 ID 必 首 先 存 在 于 其 签名 的 
参数 之 中 中。 继而 几何 着 色 器 就 能 使 用 图 元 ID 或 将 其 传 至 像素 着 色 器 阶 
段 〈 抑 或 同时 执行 这 两 种 操作 ) 。 





注 意 Note 


输入 奢 配 器 也 能 够 生成 顶点 ID 。 为 了 实现 这 一 点 ， 我 们 需要 问 顶 点 
着 色 器 签名 额外 添加 一 个 由 语义 SV_VertexID 修 饰 的 uint 类 型 的 参 
数 : 





VertexOut VS(VertexIn vin, uint vertID : SV_VertexID) 


{ 
// 顶点 着 色 器 的 主体 


D 


此 时 ， 对 于 绘制 方法 DrawInstanced 来 说 ， 其 调用 过 程 中 的 顶点 ID 
将 被 标记 为 0,1…,7 一 1， 这 里 的 n 即 为 本 次 绘制 调用 中 的 顶点 数量 。 而 对 
于 DrawIndexedInstanced 绘 制 方法 而 言 ， 其 顶点 有 D 则 对 应 于 顶点 的 索 


引 值 。 


12.3 ”纹理 数组 


12.3.1 概述 


顾名思义 ， 纹 理 数组 即 为 存放 纹理 的 数组 。 就 像 所 有 的 资源 〈 纹 理 
与 缓冲 区 ) 一 样 ， 在 C++ 代码 中 ， 纹 理 数 组 也 由 ID3D12Resource 接 口 
来 表示 。 当 创建 ID3D12Resource 对 象 时 ， 可 以 通过 设 
置 DepthorArraySize 属 性 来 指定 纹理 数组 所 存储 的 元 素 个 数 〈 对 于 3D 
纹理 来 说 ， 此 项 设 定 的 则 为 深度 值 ) 。 我 们 在 d3dApp.cpp 文 件 中 创建 深 
度 / 模 板 纹理 时 ， 总 是 将 该 值 设 为 1。 如 果 碍 看 
CommonDDSTextureLoader.cpp 中 的 CreateD3DResources12 函 数 ， 便 
会 明白 这 些 代码 究竟 是 如 何 来 创建 纹理 数组 与 体 纹理 〈volume texture ) 
的 。 在 HLSL 文 件 中 ， 纹 理 数组 是 通过 Texture2DArray 类 型 来 表示 的 : 


Texture2DArray gTreeMapArray; 


现在 ， 我 们 必须 搞 清 楚 为 什么 要 使 用 纹理 数组 ， 而 不 是 像 下 面 那 样 
做 : 











Texture2D TexArray[4]; 


float4 PS(GeoOut pin) : SV_Target 





{ 
float4 c = TexArray[pin.PrimID%4].Sample(samLinear, pin.Tex); 


在 着 色 器 模型 5.1 (Direct3D 12 所 对 应 的 新 模型 版 本 ) 本 
这 样 写 ， 但 这 在 之 前 的 Direct3D 版 本 中 却 是 行 不 通 的 。 再 者 ， 以 这 种 方 





式 来 索引 纹理 可 能 会 依 具体 硬件 而 产生 少量 开销 ， 所 以 本 章 我 们 将 使 用 
纹理 数组 。 


12.3.2 ”对 纹理 数组 进行 采样 


在 公告 牌 示 例 中 ， 我 们 用 以 下 代码 对 纹理 数组 进行 采样 [9]: 


float3 uvw = float3(pin.TexC, pin.PrimID%4); 


float4 diffuseAlbedo = gTreeMapArray.Sample( 
gsamAnisotropicWrap, uvw) * gDiffuseAlbedo; 





使 用 纹理 数组 共 需 要 3 个 坐标 值 : 前 两 个 坐标 就 是 普通 的 2D 纹 理 坐 
标 ， 第 三 个 坐标 则 是 纹理 数组 的 索引 。 例 如 ，0、1、2 分 别 是 数组 中 的 
第 一 个 、 第 二 个 以 及 第 三 个 纹理 的 索引 ， 后 面 的 索引 则 以 此 类 推 。 


在 公告 牌 示 例 中 ， 我 们 采用 的 是 一 个 具有 4 个 纹理 元 素 的 纹理 数 
组 ， 且 每 个 元 素 中 都 存 有 独特 的 树木 纹理 〈 见 图 12.7) 。 但 是 ， 由 于 每 
次 绘制 调用 所 画 出 的 树木 要 多 于 4 棵 ， 所 以 图 元 ID 势必 也 要 大 于 3。 
此 ， 我 们 对 图 元 ID 进行 模 4 运 算 (pin.PrimID % 4) ， 将 其 值 映 射 为 
0、1、2 或 3， 继 而 使 数组 元 素 拥有 合理 的 数组 索引 。 

















图 12.7 树木 公告 牌 所 用 的 图 片 


纹理 数组 的 优点 之 一 是 可 以 在 一 次 绘制 调用 过 程 中 ， 画 出 一 系列 具 
有 不 同 纹理 的 图 元 。 一 般 来 说 ， 我 们 必须 用 不 同 的 纹理 来 对 每 一 个 有 着 
独立 泻 染 项 的 网 格 进 行 处 理 : 





SetTextureA( ) ; 
DrawPrimitivesWithTextureA(); 


SetTextureB(); 
DrawPrimitivesWithTextureB(); 


SetTextureZ() ; 
DrawPrimitivesWithTextureZ() ; 





每 当 设 置 纹理 或 绘制 调用 的 时 候 都 会 相应 地 产生 一 些 开 销 。 但 使 用 
了 纹理 数组 ， 我 们 就 能 将 设置 纹理 与 绘制 调用 的 过 程 都 减少 到 一 次 : 


SetTextureArray(); 
DrawpPrimitivesWithTextureArray() ; 


12.3.3 ”加 载 纹理 数组 


位 于 Common/DDSTextureLoader.h/.cpp 文 件 中 的 代码 ， 可 以 加 载 存 
有 纹理 数组 的 DDS 文 件 。 因 此 ， 重 点 就 沙 在 了 创建 含有 纹理 数组 的 DDS 
文件 上 。 为 此 ， 我 们 需要 使 用 微软 公司 所 提供 的 texassemble 工 具 。 通 过 
下 列 语法 ， 此 工具 可 以 将 t0.dds、t1.dds、t2.dds 与 t3.dds 这 4 个 图 像 合 并 成 
一 个 名 为 treeArray.dds 的 纹理 数组 : 


texassemble -array -0o treeArray.dds tO.dds tl1.dds t2.dds t3.dds 


注意 ， 在 用 texassemble 程 序 构建 纹理 数组 时 ， 输 入 的 多 个 图 像 只 能 
各 有 一 种 mipmap 层 级 。 经 texassemble 创 建 的 纹理 数组 ， 可 以 再 根据 需求 
通过 texconv 工 具 生 成 多 种 mipmap 层 级 ， 并 改变 纹理 的 格式 : 


texconv -m 16 -f BC3_ UNORM treeArray .dds 





12.3.4 ”纹理 子 资 源 


前 面 刚 刚 讨论 过 纹理 数组 ， 下 面 来 谈 一 谈 它 的 子 资 源 
CSubresource) 。 图 12.8 展 示 了 一 个 拥有 硅 干 纹理 的 纹理 数组 ， 其 中 的 
纹理 还 各 有 自己 的 mipmap 链 。Direct3D API 用 术语 数组 切片 (array 
slice) 来 表示 纹理 数组 中 的 某 个 纹理 及 其 mipmap 链 ， 又 用 术语 mip 切 方 
(mip slice) 来 表示 纹理 数组 中 特定 层级 的 所 有 mipmap。 子 资源 则 是 指 
纹理 数组 中 某 纹 理 的 单个 mipmap 层 级 。 









mip 切 片 : 


位 于 纹理 数组 中 第 ;个 数组 切片 、 
第 /个 mip 切 片 处 的 子 资 源 


图 12.8 ”有 着 4 个 纹理 的 纹理 数组 。 每 个 纹理 都 有 3 种 mipmap 层 级 
这 惑 是 说 ， 知 给 出 纹理 数组 的 索引 以 及 mipmap 层 级 ， 我 们 融 能 访 
问 纹理 数组 中 的 相应 子 资源 。 值 得 注意 的 是 ， 子 资源 也 是 由 线性 索引 来 
标记 的 ， 而 Direct3D 所 用 的 线性 索引 规则 如 图 12.9 所 示 。 














图 12.9 在 纹理 数组 中 由 线性 索引 来 标记 的 子 资源 





下 面 的 实用 工具 函数 可 根据 给 出 的 mip 切 片 索 引 、 数 组 切片 索引 、 
平面 切片 9 索引 、mipmap 层 级 以 及 纹理 数组 的 大 小 ， 直 接 计算 出 子 资源 
的 线性 索引 : 


inline UINT D3D12CalcSubresource( UINT MipSlice, UINT ArraySlice， 
UINT PlaneSlice, UINT MipLevels, UINT ArraySize ) 


{ 


return MipSlice + ArraySlice * MipLevels + PlaneSlice * MipLevels * Arra 
ySize; 


} 





12.4 ”alpha-to-coverage 技 术 


[Ey 


竺 运行 “Tree Billboard” 演 示 程 序 时 ， 辱 以 特定 距离 观察 树木 公告 
牌 ， 便 会 发 现 其 裁剪 的 边缘 部 分 呈 锯 齿 状 。 这 个 问题 出 在 clip 函 数 上 ， 
我 们 用 它 来 遮 泌 不 属于 树木 纹理 的 像素 。 此 裁 盘 函数 负 和 贡 像 素 的 生 杀 大 
权 ， 也 导致 了 树木 边缘 的 过 渡 不 够 平滑 。 观 察 者 与 公告 牌 之 间 的 距离 也 
趁机 推 波 助 调 ， 因 为 两 者 距离 过 近 会 引起 纹理 放大 Cmagnification ) 的 
发 生 ， 继 而 使 块 状 失真 更 加 明显 。 不 仅 如 此 ， 近 距离 还 将 导致 低 分 辨 率 
mipmap 层 级 的 启用 。 





解决 此 问题 的 方法 之 一 是 以 透明 混合 取代 alpha 测 试 。 通 过 线性 纹理 
过 滤 ， 使 边缘 像素 稍 显 模糊 ， 从 而 促使 由 白 《〈 不 透明 的 像素 ) 至 黑 《〈 补 
遮 鹿 的 像素 ) 的 过 渡 更 为 平滑 。 即 透明 混合 将 使 公告 牌 图 像 边 缘 的 不 透 
明 像 素 到 被 遮 尝 像素 之 间 实 现 平 滑 的 渐变 。 可 是 ， 运 用 透明 混合 需要 将 
场景 中 的 物体 按 从 后 至 前 的 顺序 进行 排序 与 泻 染 。 对 为 数 不 多 的 树木 公 
告 牌 排序 用 不 了 多 少 开 销 ， 但 知 渔 染 的 是 一 片 树林 或 一 片 草原 ， 则 每 由 
中 排序 所 付出 的 代价 却 是 不 容 小 裔 的 。 不 止 于 此 ， 更 糟糕 的 还 要 说 是 由 
后 至 前 的 排序 过 程 ， 这 将 引发 大 量 的 重复 绘制 〈overdraw， 见 第 11 章 中 
的 练习 8) 操作 ， 会 直接 将 我 们 的 应 用 程序 置 于 死地 。 











这 时 ， 不 妨 试 一 试 MSAA (多 重 采 样 抗 锯齿 技术 ，multisampling 
参见 4.1.7 节 ) ， 它 可 用 于 缓解 多 边 形 边 沿 的 锯齿 效果 ， 
从 而 使 之 相对 平滑 。 该 技术 确实 有 效 ， 但 也 市 来 了 一 些 问 题 。MSAA 会 
为 每 个 像素 逐一 执行 一 次 像素 着 色 器 ， 使 像素 着 色 器 在 像素 的 中 心 采 


antialiasing 








样 ， 并 基于 可 视 性 (visibility， 每 个 子 像素 所 执行 的 深度 /模板 测试 结 
果 ) 与 禾 新 情况 (coverage， 子 像素 的 中 心 位 于 多 边 形 的 内 部 还 是 外 
， 将 颜色 信息 共享 给 它 的 子 像素 (subpixel) 。 而 更 为 关键 的 是 ， 
ne 力 形 层 级 (polygon level) 上 才 确 定 下 来 的 。 因 此 ， 
MSAA 并 不 会 检测 alpha 通 道 所 定义 的 树木 公告 牌 的 裁剪 边缘 ， 而 只 是 天 
注 纹理 所 映射 到 四 边 形 的 边缘 。 有 读者 会 问 ， 那 到 底 有 没有 办 法 通知 
Direct3D， 使 它 在 计算 才 盖 情况 时 考虑 alpha 通 道 这 个 因素 呢 ? J 
定 的 ， 这 便 是 被 称 之 为 alpha-to-coverage”( 有 译作 由 透明 至 履 疼 
等 ) 的 技术 。 





在 开启 了 MSAA 与 alpha-to-coverage 后 〈 令 成 
员 D3D12_BLEND_DESC: :AlphaToCoverageEnable = true 来 实 
现 ) ， 硬 件 就 会 检测 像素 着 色 器 所 返回 的 alpha 值 ， 并 将 其 用 于 确定 履 兰 
的 情况 [INVIDIA05]。 例 如 ， 在 使 用 4X MSAA 时 ， 若 像素 着 色 器 返回 的 
alpha 值 为 0.5， 则 我 们 即 可 认为 此 像 隶 里 4 个 子 像 妹 中 的 2 个 位 于 多 边 形 
的 范围 之 外 ， 并 据 此 来 创建 平滑 的 图 像 边缘 。 


0 在 以 alpha 遮 置 的 方式 来 裁剪 树叶 与 围栏 这 类 纹理 时 ， 建 
是 使 用 alpha-to- ON 当然 ， 前 提 是 需要 开启 MSAA。 在 演 
有 可 以 通过 Set4xMsaaSstate 函 数 使 示例 框架 创建 出 支持 4X 
MSAA 的 后 台 缓 冲 区 与 深度 缓冲 区 191。 


12.5 小 经 


1. 假设 我 们 不 使 用 曲面 细 分 这 个 步骤 ， 则 几何 着 色 器 这 个 可 选 阶 
段 将 位 于 顶点 着色 器 与 像 系 着 色 右 这 两 个 阶段 之 间 。 几 何 厦 色 器 会 针对 
输入 装配 器 传 来 的 每 一 个 图 元 进行 调用 并 执行 处 理 。 通 过 配置 ， 它 可 以 
不 输出 图 元 ， 也 能 输出 一 个 或 一 个 以 上 的 图 元 。 而 输出 的 图 元 类 型 ， 也 
可 能 与 输入 图 元 的 类 型 并 不 相同 。 在 输出 的 图 元 顶点 离开 几何 着 色 器 之 
前 ， 应 当 将 其 变换 到 齐 次 裁 允 空间。 接 下 来 ， 从 几何 着 色 器 输出 的 图 
元 ， 会 进入 泻 染 流水 线 的 光栅 化 阶段 。 几 何 着 色 需 应 编写 在 效果 文件 
中 ， 并 紧邻 顶点 着 色 器 与 像素 着 色 器 (处 于 二 者 之 间 )。 














2. 公告 牌 技术 采用 的 是 附 有 图 像 的 四 边 形 对 象 ， 可 将 它 作 为 真实 
3D 模 型 对 象 的 一 种 苦 代 品 。 对 于 远 处 的 物体 来 说 ， 公 告 牌 足以 以 假 乱 
真 。 各 具有 纹理 的 四 边 形 能 够 满足 用 户 的 需求 ， 则 筷 的 优点 便 是 可 以 贡 
省 GPU 泻 染 整 个 3D 对 象 的 处 理 时 间 。 这 项 技术 可 用 于 渔 染 森林 中 的 树 
木 ， 离 摄像 机 近 的 可 用 真正 的 3D 几 何 体 ， 而 远 处 的 树木 用 公告 牌 即 
可 。 为 了 使 公告 牌 更 加 逼真 ， 一 定 要 令 它 总 是 面 问 摄像 机 。 而 且 ， 在 几 
何 着 色 器 中 实现 公告 牌 技术 往往 是 最 适合 的 。 


3. 我 们 可 以 把 一 种 由 语义 SV_PrimitiveID 修 饰 的 特殊 uint 类 型 
参数 加 入 到 几何 着 色 器 的 参数 列表 之 中 ， 其 示例 代码 如 下 : 
[maxvertexcount(4)] 


void GS(point VertexOut gin[1], 
uint primID : SV_PrimitiveID, 


inout TriangleStream<GeoOut> triStream); 





右 指 定 了 此 语义 ， 它 就 会 告知 输入 装配 喜 环 节目 动 为 每 个 图 元 生成 
一 个 图 元 ID。 当 执行 的 绘制 调用 要 男 n 个 图 元 时 ， 第 一 个 图 元 被 标记 为 
0， 第 二 个 图 元 将 标记 为 1， 并 以 此 类 推 ， 直 至 绘制 调用 中 的 最 后 一 个 图 
元 被 标记 为 n 一 1。 如 果 用 户 没 有 使 用 几何 着 色 器 ， 则 应 当 将 图 元 ID 参 数 
添加 至 像素 着 色 器 的 参数 列表 内 。 但 是 ， 大 使 用 了 几何 着 色 器 ， 那 么 一 
定 要 把 图 元 ID 参数 设置 在 几何 着 色 需 的 签名 当中 。 接 下 来 ， 几 何 着 色 喜 
就 会 运用 此 图 元 ID， 或 将 其 传 入 像素 着 色 器 阶段 (抑或 同时 执行 这 两 种 
操作 ) 。 











4. 输入 装配 器 阶段 可 以 生成 顶点 ID。 为 此 ， 我 们 需要 向 顶点 着 色 
器 签名 添加 额外 的 uint 类 型 参数 ， 并 为 它 辅 以 SV_VertexID 语 义 。 对 
于 DrawInstanced 函 数 来 说 ， 此 绘制 调用 中 的 顶点 ID 将 依次 被 标记 为 : 
0, 1 ..…, 7n 一 1， 其 中 n 为 此 调用 过 程 中 的 顶点 个 数 。 而 针对 
DrawIndexedInstanced 函 数 而 言 ， 其 顶点 ID 则 对 应 于 顶点 的 索引 值 。 


5. 见 名 知 意 ， 纹 理 数组 即 存 有 纹理 的 数组 。 在 C++ 代码 中 ， 纹 理 
数组 就 像 其 他 的 资源 一 样 〈 纹 理 与 缓冲 区 ) 用 ID3D12Resource 接 口 来 
表示 。 在 创建 ID3D12Resource 对 象 时 ，DepthorArraySize 就 是 用 于 
指定 纹理 数组 中 元 素 个 数 的 属性 〈 对 于 3D 纹 理 来 说 ， 它 指定 的 是 资源 
的 深度 值 ) 。 而 在 HLSL 中 ， 纹 理 数组 由 类 型 Texture2DArray 来 表示 。 
使 用 纹理 数组 时 ， 共 需要 三 个 纹理 坐标 。 前 两 个 坐标 是 普通 的 2D 纹 理 
坐标 ， 第 三 个 坐标 则 是 纹理 数组 中 的 索引 。 例 如 ，0、1、2 分 别 为 数组 
中 前 3 个 纹理 的 索引 ， 后 面 的 则 依 此 类 推 。 使 用 纹理 数组 的 优点 之 一 
是 : 我 们 可 以 在 单 次 绘制 调用 的 过 程 中 ， 以 多 种 不 同 的 纹理 演 染 出 一 系 


列 图 元 。 而 每 个 图 元 都 有 一 个 指 癌 纹 理 数组 的 索引 ， 它 指定 了 图 元 所 应 
用 的 纹理 。 


6. 在 确定 子 像素 的 履 盖 情况 时 ，alpha-to-coverage 可 指挥 硬件 检查 
像素 着 色 器 所 返回 的 alpha 数 据 。 开 启 这 项 技术 可 以 使 树叶 和 围栏 这 样 的 
alpha 遮 时 裁剪 纹理 具有 平滑 的 边缘 。Alpha-to-coverage 的 开启 与 否 由 
PSO 中 的 D3D12_BLEND_DESC: :AlphaToCoverageEnable 字 段 来 决 
定 。 


12.6 练习 


1. 思考 一 下 ， 如 何 用 线条 带 在 z: 平 面 内 绘制 一 个 圆 形 ， 以 及 如 何 
运用 几何 着 色 器 将 此 线条 带 扩 展 为 一 个 不 市 上 下 的 的 圆柱 体 。 


2. 正二 十 面体 是 一 种 粗略 近似 于 球体 的 几何 图 形 。 通 过 对 每 个 三 
角形 进行 细 分 〈 见 图 12.10) ， 并 在 球面 上 投影 新 生成 的 顶点 ， 我 们 就 
能 获得 更 通 近 于 球体 的 几何 体 〈 由 于 所 有 单位 向 量 的 首部 都 在 单位 球面 
之 上 ， 因 此 ， 可 以 将 顶点 投影 到 单位 球面 上 的 操作 简单 地 视 为 对 位 置 向 
量 进行 规范 化 处 理 ) 。 在 这 个 练习 当中 ， 先 要 构建 并 演 染 出 一 个 正二 十 
面体 。 再 根据 它 与 摄像 机 之 间 的 距离 4， 用 几何 着 色 器 对 此 正二 十 面体 
逐步 进行 细 分 。 例 如 ， 如 果 d < 15， 则 对 原始 的 正二 十 面体 细 分 两 次 ; 
若 15 < d <30， 就 对 初始 的 正二 十 面体 执行 一 次 细 分 ; 当 d > 30 时 ， 直 
接 演 染 初始 的 正二 十 面体 即 可 。 整 体 的 思路 就 是 : 仅 在 物体 距离 摄像 机 
较 近 的 时 候 ， 才 使 用 数量 较 多 的 多 边 形 进 行 泻 染 ， 使 其 表现 得 更 为 细 
用， 知 对 和 象 离 观察 位 置 较 远 ， 则 使 用 较为 粗糙 的 网 格 即 可 ， 我 们 也 无 需 
浪费 GPU 资源 去 处 理 本 就 看 不 清 的 物体 细节 。 图 12.10 分 别 以 线 框 模式 
与 实体 〈 光 照 ) 模式 ， 接 连 展 示 了 3 种 多 面体 的 LOD 细节 级 别 level-of- 
detail) 。 此 习题 中 所 用 的 曲面 细 分 与 正二 十 面体 知识 可 回顾 7.4.3 节 中 
的 相关 讨论 。 

















图 12.10 ”通过 将 顶点 投影 到 单位 球面 上 的 方法 对 正二 十 面体 进行 细 分 











3. 通过 令 三 角形 随时 间 函 数 沿 其 平面 法 线 的 方 癌 进行 平移 ， 我 们 
就 能 模拟 出 简单 的 爆炸 效果 。 这 个 模拟 过 程 可 在 几何 着 色 器 中 实现 。 针 
对 每 个 输入 到 几何 着 色 器 的 三 角形 来 说 ， 先 以 着 色 器 计算 其 平面 法 线 n 
。 待 爆炸 开始 后 ， 沿 方向 Rn 平移 的 三 角形 顶点 P9、Pl 和 P2 在 时 刻 t 的 位 置 


分 别 为 : 











Pp 二 Pi+tn 其 中 i=0,1,2 


平面 法 线 m 不 一 定 是 单位 长 度 ， 可 对 其 进行 缩放 以 控制 爆炸 的 速 
度 。 我们 甚至 可 以 根据 图 元 ID 来 调 市 平面 法 线 的 长 度 ， 以 使 每 个 图 元 都 
能 按 不 同 的 弹 冉 速度 四 处 飞溅 。 用 一 个 正三 十 面体 (不 需要 细 分 ) 作 为 
实验 的 网 格 来 实现 爆炸 的 效果 。 











4. 令 网 格 的 顶点 法 线 可 视 化 通常 会 更 便于 调试 。 编 写 一 个 效果 文 
件 ， 将 网 格 的 项 点 法 线 都 演 染 为 短线 段 。 为 了 做 到 这 一 点 ， 我 们 需要 实 
现 一 个 以 网 格 的 点 图 元 作为 输入 数据 的 几何 着 色 器 〈 即 以 图 元 拓 


扑 D3D_PRIMITIVE_TOPOLOGY_POINTLIST 来 表示 网 格 中 的 诸 顶 点 ) ， 
从 而 将 每 个 顶点 传 至 几何 着 色 器 阶段 。 这 时 ， 该 几何 着 色 器 便 能 够 将 每 
个 点 扩展 为 长 度 为 的 线段 。 若 顶点 的 位 置 为 P 且 法 线 为 m， 则 其 对 应 的 
2 个 线段 端点 就 能 分 别 表示 为 P 与 P+ Ln。 待 上 述 内 容 能 够 顺利 实现 之 
后 ， 先 照常 绘制 一 裔 网 格 ， 后 以 法 同 量 可 视 化 技术 再 泻 染 一 人 裔 场景 ， 以 
此 令 法 线 绘制 在 场景 的 上 面 ， 便 于 观察 。 对 了 ， 这 个 练习 要 以 “Blend 
Demo”〈 混 合 ) 演示 程序 作为 测试 场景 。 





5. 本 练习 与 上 一 个 练习 比较 相似 : 编写 一 个 将 网 格 的 平面 法 线 泻 
染 为 短线 段 的 效果 文件 。 对 此 效果 文件 而 言 ， 儿 何 着 色 器 应 以 三 角形 作 
为 输入 数据 ， 并 计算 其 平面 法 线 及 输出 短线 段 。 


6. 本 练习 将 展示 : 对 于 DrawInstanced 方 法 而 言 ， 其 绘制 调用 过 
程 中 的 顶点 ID 会 以 0,1,…,7 一 1 来 加 以 标记 ， 这 里 的 n 为 绘制 调用 过 程 中 
所 用 的 顶点 个 数 ， 而 针对 DrawIndexedInstanced 方 法 调用 来 说 ， 顶 点 
ID 则 对 应 于 其 顶点 的 索引 值 。 





按 下 列 方式 来 修改 “Tree Billboards” 演 示 程 序 。 首 先 ， 将 顶点 着 色 器 
的 代码 改写 为 : 


VertexOut VS(VertexIn vin, uint vertID : SV VertexID) 
{ 


VertexOut vout; 





// 直接 将 数据 传递 给 几何 着 色 器 





vout.CenterW = Vin.PosW; 
vout.SizeW = float2(2+vertID, 2+vertID); 


return vout; 





换 名 话说， 这 段 代 码 将 基于 树木 公告 牌 的 中 心 ， 按 顶点 呈 的 数值 来 
对 公告 牌 进行 缩放 。 直 接 运 行程 序 ， 在 绘制 完 16 个 公告 牌 时 ， 它 们 的 大 
小 应 当 在 范围 为 2 一 17。 现 在 再 来 修改 公告 牌 的 绘制 方法 ， 之 前 的 单 次 
绘制 调用 一 次 性 可 泻 染 16 个 点 ， 而 本 次 则 以 4 次 DrawInstanced 调 用 来 
加 以 取代 ， 就 像 这 样 : 





if(ritems[i]->Geo->Name=="treeSpritesGeo"){ 
cmdList->Drawlnstanced(4,1,06,0); 
cmdList->Drawlnstanced(4,1,4,9) 
cmdList->Drawlnstanced(4,1,8,0); 


cmdList->Drawlnstanced(4,1,12,0); 
}elset{ 
cmdList->Drawlndexedlnstanced(ri->lndexCount,1,ri->StartlndexLocation 
,ri-> 
BaseVertexLocation.0); 








再 次 运行 程序 .…… 这 一 次 ， 公 告 牌 的 大 小 会 处 于 范围 为 2 一 5。 这 是 
/人 


为 0 一 3。 最 后 再 答 试 借助 一 个 索引 缓冲 区 以 及 4 

次 DrawIndexedInstanced 调 用 绘制 树木 公告 牌 。 运 行程 序 之 后 ， 便 会 
发 现 公告 牌 的 大 小 又 重新 回 到 范围 2 一 17。 这 是 因为 在 使 

用 DrawIndexedInstanced 方 法 时 ， 顶 点 ID 将 对 应 于 顶点 的 索引 值 。 


7. 通过 下 列 方 式 来 修改 “Tree Billboards” 演 示 程 序 。 首 先 ， 从 像素 
着 色 器 中 去 掉 “ 模 4 运算 ”: 


现在 再 来 运行 程序 。 由 于 我 们 共 绘 制 了 16 个 图 元 ， 图 元 ID 的 范围 为 
0 一 15， 因 而 这 些 ID 会 超出 像素 数组 的 边界 。 然 而 ， 这 实际 上 并 不 会 导 











致 错误 的 发 生 ， 因 为 越界 的 索引 值 会 被 钳制 为 最 大 的 有 效 索 引 《〈 这 里 即 
为 3) 。 再 按 如 下 方法 以 4 次 DrawInstanced 绘 制 调 用 取代 之 前 的 一 次 性 
绘制 16 个 点 : 
if(ritems[i]->Geo->Name=="treeSpritesGeo"){ 
cmdList->Drawlnstanced(4,1,06,06); 


cmdList->Drawlnstanced(4,1,4,06); 
cmdList->Drawlnstanced(4,1,8,09) 


cmdList->Drawlnstanced(4,1,12,0); 
}elset{ 
cmdList->Drawlndexedlnstanced(ri->lndexCount,1,ri->StartlndexLocation 
,ri-> 





BaseVertexLocation.0); 





再 次 运行 程序 。 因 为 每 次 DrawInstanced 调 用 共 绘 制 4 个 图 元 ， 所 以 
每 次 绘制 调用 过 程 中 的 图 元 ID 范 围 为 0~3， 也 束 不 用 再 进行 钳 位 操作 
了 。 这 样 一 来 ， 即 可 将 图 元 ID 用 作 索 引 ， 还 不 会 及 生 越 界 的 情况 。 这 个 
示例 充分 展示 了 在 每 次 绘制 调用 时 ， 图 元 ID 的 “计数 ”都 会 被 重 置 为 0 的 
现象 。 





[1] 文献 中 给 出 的 例子 是 ， 如 果 顶 点 结构 体 中 定义 了 “float3 pos: 
POSITION;” 与 “float2 tex: TEXCOORD;” 这 两 项 成 员 ， 意 即 每 个 顶点 
元 素 中 含有 5 个 标量 。 假 设 此 时 将 maxvertexcount 设 置 为 4， 则 几何 着 
色 吉 每 次 输出 20 个 标量 ， 以 峰值 性 能 执行 。 此 文献 公布 于 2008 年 ， 这 上 段 
描述 针对 的 GPU 型 号 为 GeForce 8800 GTX。 








[2] RestartSstrip 函 数 表 示 结 束 当 前 三 角形 带 的 绘制 ， 下 面 绘制 另 一 
个 三 角形 带 。 每 3 个 顶点 调用 一 次 RestartSstrip 表 示 每 3 个 顶点 组 成 一 
个 三 角形 囊 ，。 也 灰 十 一 个 三 放 形 列表 。 





[3] 例如 ， 如 果 在 处 理 三 角形 带 中 的 最 后 一 个 三 角形 时 ,哎呀 ， 少 了 个 
顶点 ， 那 么 这 最 后 一 个 三 角形 就 默认 失踪 了 ..………. 


[4] 玩 过 《暴力 摩托 》 的 读者 一 定 会 明白 作者 在 说 什么 .……. 


[5] 原文 为 effects， 即 效果 。DirectX 12 之 前 的 版 本 提供 了 一 种 已 开源 
的 “效果 框架 ”(effects framework) ， 使 用 户 可 以 在 运行 时 更 便捷 地 管理 
泻 染 流水 线 的 状态 、HLSL 着 色 右 以 及 运行 时 变量 等 。 但 在 DirectX 12 
中 ， 这 套 框 架 已 不 复 存 在 。 本 书 中 还 存 有 此 用 语 奋 干 处 ， 现 都 译 为 效果 
文件 ， 其 意 与 HLSL 文 件 等 价 。 








[6] 精灵 ，sprite。 通 冲 来 讲 ， 是 一 种 不 经 泻 染 流水 线 而 直接 绘制 到 洽 
染 目标 的 2D 位 图 。 公 告 牌 实 为 应 用 于 3D 环 境 中 的 精灵 ， 是 具有 alpha 通 
道 且 面 癌 摄 像 机 的 图 像 。DirectX 8 至 DirectX 10 专 门 提 供 了 一 组 绘制 精 
灵 的 相关 函数 ， 但 从 DirectX 11 开始， 这 些 函 数 便 被 取消 了 。 如 今 ， 实 
现 精灵 的 方法 可 参见 《Multiple Ways to Render Point Sprites in DX11》 


与 《Sprites and textures》 。 


[7] 简 言 之 ， 知 存在 几何 着 色 器 ， 则 几何 着 色 器 中 首 获 图 元 ID; 若 不 
存在 儿 何 着 色 器 ， 则 像素 着 色 嚣 首 获 图 元 ID。 此 二 者 谁 离 输 入 装配 融 阶 
段 最 近 并 被 开局 ， 谁 先 获得 图 元 ID。 


[8] 本 书 代码 中 实际 写作 “pin.PrimID%3”， 如 果 dds 文 件 中 有 4 种 树木 
图 像 的 话 ， 应 当 为 “pin.PrimID%4”。 


[9] 在 Direct3D 12 中 ， 新 引入 了 术语 平面 切片 ， 即 plane slice。 它 使 用 


户 能 将 某 些 YUV 平 面 格式 (planar format) 的 分 量 以 索引 方式 单独 提取 
出 来 ， 以 供 使 用 。 知 程序 不 涉及 此 功能 ， 可 将 参数 PlaneSlice 设 置 为 
0。 


[10] “Tree Billboard” 演 示 程 序 默 认为 不 开局 MSAA， 我 们 可 以 通过 F2 
键 进 行 切换 。 满 心 欢喜 地 按 下 F2 键 后 .…… 肯 溃 .……. 莫非 我 用 的 是 假 的 
DirectX 12? ! ) 经 查阅 ， 最 终 在 DirectXTK12 的 wiki 文档 Simple 
rendering 中 发 现 ，Direct3D 12 并 不 文 持 创建 MSAA 交 换 链 (这 与 DirectX 
12 玉 用 新 式 “flip” 类 型 的 交换 链 有 关 ，MSAA 仪 支持 旧式 的 “bit-blt”* 类 型 
交换 链 ， 但 在 作者 用 的 预览 厂 里 很 可 能 还 在 文 持 直接 创建 MSAA 交 换 
链 。 关 于 新 旧式 交换 链 类 型 的 讨论 文章 有 很 多 ， 如 《For best 
performance, use DXGI flip model》 等 ) 。 解 决 的 办 法 是 用 户 要 自行 创建 
MSAA 演 染 目 标 。 如 果 读 者 在 运行 时 也 发 生 同 样 的 错误 ， 可 以 尝试 从 这 
个 方 癌 着 手 。 其 实 《Simple rendering》 一 文中 已 给 出 了 MSAA 的 正确 打 
开 方式 。 现 在 ， 微 软 已 对 此 专门 提供 了 演示 程序 ， 可 参见 
SimpleMSAA_UWP12 例 程 。 全 书 对 UWP 方 面 的 编程 只 字 未 提 ， 读 者 正 
好 可 借 此 机 会 做 些 了 解 ) 。 





第 13 章 ”计算 着 色 器 


当今 的 GPU 已 经 针对 单 址 或 连续 地 址 的 大 量 内 存 处 理 〈( 亦 称 为 流 式 
操作 ，streaming operation) 进行 了 优化 ， 这 与 CPU 面 同 内 存 随 机 访问 的 
设计 理念 则 刚好 背道而驰 [Boyd10]。 再 者 ， 考 虑 到 要 对 顶点 与 像素 分 别 
进行 单独 的 处 理 ， 因 此 GPU 现 已 经 采用 了 大 规模 并 行 处 理 架 构 。 例 如 ， 
NVIDIA 公 司 开发 的 "Fermi" 架 构 最 多 可 文 持 16 个 流 式 多 处 理 需 

(streaming multiprocessor，SM) ， 而 每 个 流 式 处 理 器 又 均 含 有 32 个 
CUDA 核 心 ， 也 就 是 共 512 个 CUDA 核 心 [NVIDIA09]。 





显然 ， 图 形 的 绘制 优势 完全 得 益 于 GPU 架构 ， 因 为 这 架构 就 是 专 为 
绘图 而 精心 设计 的 。 但 是 ， 一 些 非 图 形 应 用 程序 同样 可 以 从 GPU 并 行 架 
构 所 提供 的 强大 计算 能 力 中 受益 。 我 们 将 GPU 用 于 非 图 形 应 用 程序 的 情 
况 称 为 通用 GPU 程序 设计 《通用 GPU 编程 。General Purpose GPU 
programming，GPGPU programming) 。 当 然 ， 并 不 是 所 有 的 算法 都 适 
合 由 GPU 来 执行 ， 只 有 数据 并 行 算 法 (data-parallel algorithm ) 才能 发 挥 
出 GPU 并 行 架 构 的 优势 。 也 就 是 次 ， 仅 当 拥 有 大 量 竺 执行 相同 操作 的 数 
据 时 ， 才 最 适宜 采用 并 行 处 理 。 像 素 着 色 这 种 图 像 处 理工 作 就 是 一 种 极 
好 的 示例 ， 因 为 每 个 被 绘制 的 像素 片段 都 要 经 过 像素 痢 色 器 的 统一 处 
理 。 义 如 ， 查 看 前 一 章 中 模拟 波浪 的 代码 便 会 发 现 ， 在 更 新 步骤 中 ， 我 
们 需要 针对 每 一 个 栅 格 元 陛 都 进行 一 过 相同 的 运算 。 因 此 ， 以 GPU 来 执 
行 这 些 计算 工作 也 是 不 错 的 选择 ， 这 样 一 来 ， 每 个 栅 格 元 素 都 可 以 由 




















GPU 并 行 地 更 新 。 粒 子 系统 则 是 另 一 个 实例 ， 我 们 可 简化 粒子 之 间 的 关 
系 模 型 ， 使 它们 彼此 坚 无 关联 ， 不 会 相互 影响 ， 以 此 使 每 个 粒子 的 物理 
特征 都 可 以 分 别 独 立地 计算 出 来 。 


对 于 GPGPU 编 程 而 言 ， 用 户 通常 需要 将 计算 结果 返回 CPU 供 其 访 
问 。 这 就 需 将 数据 由 显存 复制 到 系统 内 存 ， 虽 说 这 个 过 程 的 速度 较 慢 
〈 见 图 13.1) ， 但 是 与 GPU 在 运算 时 所 缩短 的 时 间 相 比 却 是 微不足道 
的 。 针 对 图 形 处 理 任务 来 次， 我 们 一 般 将 运算 结果 作为 演 染 流水 线 的 输 
入 ， 所 以 无 须 再 由 GPU 向 CPU 传输 数据 。 例 如 ， 我 们 可 以 用 计算 着 色 器 
(compute shader) 对 纹理 进行 模糊 处 理 (blur) ， 再 将 着 色 器 资源 视图 
《shader resource view) 与 模糊 处 理 后 的 纹理 相 绑 定 ， 以 作为 着 色 器 的 
输入 。 








图 13.1 根据 [Boyd10] 文 献 重 新 绘制 的 示意 图 。 图 中 所 示 的 是 CPU 与 RAM (系统 内 存 ) 、CPU 

与 GPU 以 及 GPU 与 VRAM (显存 ) 之 间 的 存储 器 带宽 速度 。 其 中 所 列 的 数字 仅 用 于 说 明 不 同 器 

件 之 间 的 传输 带宽 在 数量 级 上 的 差别 。 显 然 ，CPU 与 GPU 之 间 的 数据 传输 速度 为 整个 系统 的 瓶 
颈 











计算 着 色 器 虽然 是 一 种 可 编程 的 着 色 器 ， 但 Direct3D 并 没有 将 它 直 
接 归 为 泻 染 流水 线 中 的 一 部 分 。 虽 然 如 此 ， 但 位 于 流水 线 之 外 的 计算 着 
色 器 却 可 以 读 写 GPU 资源 〈 见 图 13.2) 。 从 本 质 上 来 说 ， 计 算 着 色 器 能 


够 使 我 们 访问 GPU 来 实现 数据 并 行 算法 ， 而 不 必 演 染 出 任何 图 形 。 正 如 
前 文 所 说 ， 这 一 点 即 为 GPGPU 编 程 中 极为 实用 的 功能 。 另 外 ， 计 算 着 
色 器 还 能 实现 许多 图 形 特效 一 一 因此 对 于 图 形 程 序 员 来 说 ， 它 也 是 极 具 
使 用 价值 的 。 前 面 提 到 ， 由 于 计算 着 色 器 是 Direct3D 的 组 成 部 分 ， 也 可 
以 读 写 Direct3D 资 源 ， 由 此 我 们 就 可 以 将 其 输出 的 数据 直接 绑 定 到 泻 染 
流水 线 上 。 























图 13.2 ”计算 着 色 器 并 非 泻 染 流水 线 的 组 成 部 分 ， 但 是 却 可 以 读 写 GPU 资源 。 而 且 计 算 着 色 器 
也 可 以 参与 图 形 的 泻 染 或 单独 用 于 GPGPU 编 程 








学 习 目 标 : 


1. 





学 习 如 何 编写 计算 独 色 需 。 


， 对 硬件 处 理 线 程 组 以 及 其 中 线程 的 方式 等 高 级 知识 有 一 定 的 认 





.探究 哪些 Direct3D 资 源 能 被 设置 为 计算 着 色 器 的 输入 与 输出 。 
. 了解 各 种 线程 ID 及 其 用 法 。 
.学 习 共 至 内 存 的 相关 知识 ， 并 知晓 它 为 何 可 以 用 于 优化 性 能 


.探索 怎样 才能 获取 更 多 关于 GPGPU 编 程 的 细 记 信息 


13.1 线程 与 线程 组 





在 GPU 编程 的 过 程 中 ， 根 据 程序 具体 的 执行 需求 ， 可 将 线程 划分 为 
由 线程 组 〈thread group) 构成 的 网 格 〈grid) 。 一 个 线程 组 运行 于 一 个 
多 处 理 器 之 上 。 因 此 ， 对 于 拥有 16 个 多 处 理 器 的 GPU 来 说 ， 我 们 至 少 应 
将 任务 分 解 为 16 个 线程 组 ， 以 此 令 每 个 多 处 理 器 都 充分 地 运转 起 来 。 但 
是 ， 要 获得 更 佳 的 性 能 ， 我 们 还 应 当 令 每 个 多 处 理 器 至 少 拥有 两 个 线程 
组 ， 使 它 能 够 切换 到 不 同 的 线程 组 进行 处 理 ， 以 连续 不 停 地 工作 
[Fung10]《〈 线 程 组 在 运行 的 过 程 中 可 能 会 发 生 停顿 ， 例 如 ， 着 色 器 在 继 
续 执 行 下 一 个 指令 之 前 会 等 待 纹理 的 处 理 结果 ， 此 时 即 可 切换 至 另 一 个 
线程 组 ) 。 





每 个 线程 组 中 都 有 一 块 共享 内 存 上 由， 供 组 内 的 线程 访问 。 但 是 ， 线 
程 并 不 能 访问 其 他 组 中 的 共享 内 存 。 同 理 ， 同 组 内 的 线程 间 能 够 进行 同 
步 操作 ， 不 同 组 的 线程 间 却 不 能 实现 这 一 点 。 事 实 上 ， 我 们 也 无 法 控制 
不 同 线程 组 间 的 处 理 顺序 ， 因 为 这 些 线程 组 可 能 正 运行 在 不 同 的 多 处 理 
器 上 。 








一 个 线程 组 中 含有 nn 个 线程 。 硬 件 实 际 上 会 将 这 些 线程 分 为 多 
个 warp 〈 每 个 warp 中 有 32 个 线程 ) ， 而 且 多 处 理 器 会 以 SIMD32 的 方式 
( 即 32 个 线程 同时 执行 相同 的 指令 序列 ) 来 处 理 warp。 每 个 CUDA 核 心 
都 可 处 理 一 个 线程 ， 前 面 也 提 到 了 ，“Fermi”* 架 构 中 的 每 个 多 处 理 器 都 
具有 32 个 CUDA 核 心 ( 因 此 ，CUDA 核 心 就 像 一 条 专 设 的 SIMD“ 计 算 通 
道 ”(lane) ) 。 在 Direct3D 中 ， 我 们 能 够 以 非 32 的 倍数 值 来 指定 线程 组 





的 大 小 。 但 是 出 于 性 能 的 原因 ， 我 们 应 当 总 是 将 线程 组 的 大 小 设置 为 
warp 尺 寸 的 整数 倍 [Fung10]。 


对 于 各 种 型 号 的 图 形 硬 件 来 说 ， 线 程 数 为 256 的 线程 组 是 一 种 普遍 
适 于 工作 的 初始 设置 。 我 们 可 以 以 此 值 为 基础 ， 再 根据 具体 需求 尝试 将 
其 调整 为 其 他 大 小 。 值 得 注意 的 是 ， 修 改 每 个 线程 组 中 的 线程 数量 也 会 
对 线程 组 的 分 派 〈dispatch， 调 度 ) 次 数 产 生 影 响 欠 。 








注 Note 和 


NVIDIA 公 司 生产 的 图 形 人 硬件 所 用 的 warp 单 位 共有 32 个 线程 。 而 
ATI 公 司 回采 用 的 “wavefront” 单 位 则 具有 64 个 线程 ， 且 建议 为 其 分 配 的 
线程 组 大 小 应 总 为 wavefront 尺 寸 的 整数 倍 [Bilodeau10]。 另 外 ， 值 得 一 
提 的 是 ， 不 管 是 warp 还 是 wavefront， 它 们 的 大 小 在 未 来 几 代 中 都 有 可 能 
a 


在 Direct3D 中 可 通过 调用 下 列 方法 来 局 动 线程 组 : 


void ID3D12GraphicsCommandList::Dispatch( 


UINT ThreadGroupCountX， 
UINT ThreadGroupCountY， 
UINT ThreadGroupCountZ ) ; 





此 方法 可 开局 一 个 由 线程 组 构成 的 3D 网 格 ， 但 是 我 们 在 本 书 中 仅 
关注 线程 组 2D 网 格 。 下 面 的 调用 示例 会 分 小 一 个 在 z 方 向 上 为 3、Y 方 同 


上 为 2， 即 总 数 为 3 x 2 = 6 个 线程 组 的 网 格 〈 见 图 13.3) 。 


cmdList->Dispatch(3，2，1); 


十 Z 





图 13.3 ”分派 一 个 规模 为 3 x 2 的 线程 组 。 此 例假 设 每 个 线程 组 都 有 8 x 8 条 线程 


13.2 ”一 个 简单 的 计算 着 色 器 


以 下 是 将 两 个 纹理 进行 简单 累加 的 计算 着 色 器 示例 ， 假 设 所 有 的 纹 
理 都 具有 相同 的 大 小 。 虽 然 该 着 色 右 有 点 索然 无 味 ， 却 五 脏 俱 全 ， 能 详 
细 地 展示 出 计算 着 色 需 的 基本 套路 语法 。 





cbuffer cbsettings 


{ 
// 计算 着 色 器 能 访问 的 常量 缓冲 区 数据 
}; 


// 数据 源 及 着 色 器 的 输出 
Texture2D gInputA,; 
Texture2D gInputB ; 
RWTexture2D<float4> gOutput ; 











// 线程 组 中 的 线程 数 。 组 中 的 线程 可 以 被 设置 为 D、2D 或 3D 的 网 格 布局 
[numthreads(16, 16, 1)] 
void CS(int3 dispatchThreadID : SV_DispatchThreadID) // 线程 ID 








{ 
// 对 两 种 源 像素 中 横 纵 坐标 分 别 为 x、y 处 的 纹 素 进行 求 和 ， 并 将 结果 保存 到 相应 的 gOutp 
ut 纹 素 中 
gOutput[dispatchThreadID.xy] = 
gInputA[dispatchThreadID .xy] + 
gInputB[dispatchThreadID .xy]; 








可 见 ， 一 个 计算 着 色 器 由 下 列 要 素 构 成 : 


1. 通过 名 量 缓冲 区 访问 的 全 局 变量 。 





2. 输入 与 输出 资源 〈 此 内 容 将 在 13.3 节 中 讨论 ) 。 


3. [numthreads(X，Y，Z)] 属 性 ， 指 定 3D 线 程 网 格 中 的 线程 数 





4. 每 个 线程 都 要 执行 的 着 色 器 指令 。 
5. 线程 ID 系统 值 参数 〈 在 13.4 节 中 讨论 ) 。 


不 难看 出 ， 我 们 能 够 根据 需求 定义 出 不 同 的 线程 组 布局 。 例 如 ， 可 
以 定义 一 个 具有 X 个 线程 的 单行 线程 组 [numthreads(X，1，1)] 或 内 
含 Y 个 线程 的 单列 线程 组 [numthreads (1，Y，1)]。 抑 或 通过 将 维度 : 
设 为 1 来 定义 规模 为 X x Y 的 2D 线 程 组 ， 形 如 [numthreads (X,Y， 
1)]。 我 们 应 结合 所 过 到 的 具体 问题 来 选择 适当 的 线程 组 布局 。 如 同 前 
一 节 中 提 到 的 那样 : 针对 NVIDIA 品 牌 的 显卡 来 说 ， 线 程 组 中 的 总 线程 
数 应 为 warp 大 小 “32) 的 整数 倍 ， 而 ATI 公 司 生产 的 显卡 应 为 wavefront 
尺寸 (64) 的 整数 倍 。 又 因 wavefront 大 小 的 倍数 〈64 x n) 必 为 warp 尺 
寸 的 倍数 (32 x m) ， 因 此 ， 以 前 者 的 线程 数 为 基础 进行 设置 对 两 种 显 
卡 都 适用 。 


计算 流水 线 状 态 对 象 





为 了 开局 计算 着 色 器 ， 我 们 还 需 使 用 其 特定 的 “计算 流水 线 状 态 描 
述 ”。 此 描述 中 的 字段 远 少 于 D3D12_ GRAPHICS_PIPELINE_STATE_DESC 
结构 体 。 这 是 因为 计算 着 色 器 位 列 图 形 流水 线 之 外 ， 因 此 所 有 的 图 形 流 
水 线 状态 都 不 适用 于 计算 着 色 器 ， 也 就 无 须 以 此 对 它 进行 设置 。 下 面 给 
出 一 个 创建 计算 流水 线 状态 对 象 的 示例 外: 











D3D12_ COMPUTE_PIPELINE STATE_ DESC wavesUpdatePso = {}; 
wavesUpdatePSO.pRootSignature = mWavesRootSignature.Get(); 
wavesUpdatePSO.CS = 

{ 


reinterpret cast<BYTE*>(mShaders["wavesUpdateCS"]->GetBufferpointer()), 
mShaders["wavesUpdateCS"]->GetBufferSize() 

}; 

wavesUpdatePSO.Flags = D3D12 PIPELINE STATE_ FLAG NONE; 

ThrowIfFailed(md3dDevice->CreateComputePipelinestate( 
&wavesUpdatePSO，IID_PPV_ARGS(&mPsos["wavesUpdate"] ) ) ); 





根 签名 定义 了 什么 参数 才 是 着 色 器 所 期 望 的 输入 (CBV、SRYV 
等 ) 。 而 cs( 即 compute shader 的 缩写 ) 字段 就 是 所 指定 的 计算 着 色 
器 。 下 列 代 码 展 示 了 一 个 将 着 色 器 编译 为 字 节 码 的 示例 : 


mShaders["wavesUpdateCS"] = d3dUtil::CompileShader( 





L"Shaders\\WaveSim.hlsl", nullptr, "UpdateWavesCS", "cs 5 6"); 


13.3 ”数据 的 输入 与 输出 资源 





能 与 计算 着 色 器 绑 定 的 资源 类 型 有 缓冲 区 与 纹理 两 种 。 我 们 已 经 用 
过 诸如 顶点 、 索 引 与 常量 这 几 类 缓冲 区 ， 在 第 9 章 中 也 演 试 过 纹理 资 
源 。 本 节 来 讲述 计算 着 色 器 所 采用 的 输入 、 输 出 资源 。 








13.3.1 ”纹理 输入 
在 前 一 节 的 计算 着 色 器 示例 中 ， 我 们 定义 了 两 个 输入 纹理 资源 : 


Texture2D gInputA,; 
Texture2D 8gInputB ; 


过 给 输入 纹理 gInputA 与 gInputB 分 别 创建 SRV (着 色 器 资源 视 
图 ) ， 再 将 它们 作为 参数 传 入 根 参数 ， 我 们 就 能 令 这 两 个 纹理 都 绑 定 为 
着 色 占 的 输入 资源 。 例 如 : 


cmdList->SetComputeRootDescriptorTable(1, mSrvA); 
cmdList->SetComputeRootDescriptorTable(2, mSrvB); 


这 个 过 程 其实 与 着 色 器 资源 视图 绑 定 到 像素 着 色 器 的 方法 相同 。 但 
意 的 是 ，SRV 都 是 只 读 资 源 。 


13.3.2 ”纹理 输出 与 无 序 访问 视图 


在 前 一 节 的 计算 着 色 器 代码 中 ， 我 们 定义 了 一 个 输出 资源 : 


| 


RWTexture2D<float4> gOutput 


计算 着 色 器 处 理 输 出 资源 的 方式 比较 特殊 ， 它 们 的 类 型 还 有 一 个 特 
别 的 前 级 “RW”， 章 为 读 与 写 。 顾 名 思 义 ， 我 们 可 以 对 计算 着 色 器 中 的 
这 类 资源 元 素 进行 读 写 操作 。 相 比 之 下 ， 纹 理 gInputA 与 gInputB 仪 为 
只 读 属性 。 当 然 ， 别 筷 记 用 人 尖 括 写 模 板 语 法 ， 如 <float4> 来 指定 输出 
资源 的 类 型 与 维 数 。 如 果 输 出 的 是 DXGI_FORMAT_R8G8_SINT 类 型 的 2D 
整 型 资源 ， 则 在 HLSL 文 件 里 应 当 这 样 写 : 





"| 


RWTexture2D<int2> gOutput 


输出 资源 与 输入 资源 的 绑 定 方法 是 全 然 不 同 的。 为 了 绑 定 在 计算 着 
器 中 要 执行 写 操作 的 资源 ， 我 们 需要 将 其 与 称 为 无 序 访问 视图 
CUnordered Access View，UAV) 的 新 型 视图 关联 在 一 起 。 在 代码 中 ， 

我 们 用 描述 符 句 柄 来 表示 无 序 访 问 视 图 ， 且 通过 结构 

体 D3D12_UNORDERED_ACCESS_VIEW_DESC 来 对 它 进行 描述 。 创 建 这 种 
视图 的 整个 过 程 与 着 色 器 资源 视图 很 相似 。 这 里 给 出 一 个 为 纹理 资源 创 
ae 











D3D12 RESOURCE DESC texDesc; 

ZeroMemory(&texDesc, sizeof(D3D12 RESOURCE DESC)); 
texDesc.Dimension = D3D12 RESOURCE DIMENSION TEXTURE2D; 
texDesc.Alignment = 6; 

texDesc.Width = mWidth; 

texDesc.Height = mHeight; 

texDesc.DepthOrArraySize = 1; 

texDesc.MipLevels = 1; 

texDesc.Format = DXGI FORMAT R8G8B8A8 UNORM; 
texDesc.SampleDesc.Count = 1; 
texDesc.SampleDesc.Quality = 6; 

texDesc.Layout = D3D12 TEXTURE LAYOUT UNKNOWN; 
texDesc.Flags = D3D12 RESOURCE_ FLAG ALLOW UNORDERED ACCESS; 


ThrowIfFailed(md3dDevice->CreateCommittedResource( 
&CD3DX12_ HEAP_ PROPERTIES(D3D12 HEAP TYPE_DEFAULT), 
D3D12_HEAP_FLAG NONE, 

&texDesc, 
D3D12 RESOURCE_ STATE COMMON, 
nullptr, 
IID_PPV_ARGS(&mBlurMape))); 


D3D12_SHADER RESOURCE VIEW DESC srvDesc = {}; 
srvDesc.Shader4ComponentMapping = D3D12 _ DEFAULT_ SHADER 4 COMPONENT_ MAPPING 


2 

srvDesc.Format = mFormat; 

srvDesc.ViewDimension = D3D12 SRV_DIMENSION TEXTURE2D; 
srvDesc.Texture2D.MostDetailedMip = 0; 
srvDesc.Texture2D.MipLevels = 1; 


D3D12 UNORDERED ACCESS VIEW DESC uavDesc = {}; 
uavDesc.Format = mFormat; 


uavDesc.ViewDimension = D3D12 UAV_ DIMENSION TEXTURE2D; 
uavDesc.Texture2D.MipSlice = 90; 


md3dDevice->CreateShaderResourceView(mB1LurMap6.Get()， 
&srvDesc, mBlureCpuSrv); 

md3dDevice->CreateUnorderedAccessView(mB1LurMap6.Get()， 
nullptr，&uavDesc，mBlLurecpuUav ) ; 





从 代码 中 可 以 看 出 ， 如 果 一 个 纹理 需要 与 UAV 相 绑 定 ， 则 此 纹理 必 
须 用 标志 D3D12_RESOURCE_FLAG_ALLOWN_UNORDERED_ACCESS 来 创建 。 
在 上 面 的 示例 中 ， 我 们 将 纹理 分 别 绑 定 为 一 个 UAV 与 一 个 SRV《 但 是 两 
者 却 不 能 同时 生效 ) 。 这 是 一 种 很 常见 的 手段 ， 因 为 我 们 通常 会 在 计算 
着 色 器 中 对 纹理 执行 某 些 操作 《〈 所 以 将 纹理 作为 UAV 绑 定 到 计算 着 色 
器 ) ， 而 后 还 可 能 用 此 纹理 对 几何 体 进 行 贴图 ， 因 此 需要 再 将 它 以 SRV 
绑 定 到 顶点 着 色 器 或 像素 着 色 器 。 





回顾 一 下 ， 类 型 为 D3D12_DESCRIPTOR_HEAP_TYPE_CBV_SRV_UAV 
的 描述 符 堆 可 以 混合 存放 CBV (常量 缓冲 区 视图 ) 、SRV 和 UAYV。 


此 ， 我 们 就 能 将 UAV 描 述 符 置 于 这 种 堆 中 。 这 些 描述 符 一 旦 位 于 堆 中 ， 
我 们 融 能 方便 地 将 描述 符 句 柄 作为 参数 传 至 根 参数 ， 使 资源 绑 定 到 流水 
线 上 ， 以 供 分 派 调 用 (dispatch call， 调 度 调 用 ) 回 使 用 。 试 考虑 以 下 用 
于 计算 着 色 器 的 根 签名 : 








void BlurApp: :BuildPpostProcessRootSignature() 

{ 
CD3DX12 DESCRIPTOR RANGE srvTable; 
srvTable.Init(D3D12 DESCRIPTOR RANGE TYPE_ SRV, 1, ©); 


CD3DX12_DESCRIPTOR_ RANGE uavTable; 
uavTable.Init(D3D12 DESCRIPTOR RANGE TYPE_UAV, 1, 0); 








// 根 参 数 可 以 是 描述 符 表 、 根 描述 符 或 根 常量 
CD3DX12 ROOT_ PARAMETER slotRootParameter[3]; 











// 提高 程序 性 能 的 小 容 门 : 按 变 更 频率 由 高 至 低 的 顺序 来 填写 根 参 数 
slotRootParameter[6].InitAsConstants(12，6); 

slotRootPparameter[1].InitAsDescriptorTable(1, &srvTable); 
slotRootParameter[2].InitAsDescriptorTable(1, &uavTable); 




















// 根 签名 由 一 系列 根 参 数 构 成 
CD3DX12_ROOT_SIGNATURE_ DESC rootSigDesc(3, slotRootParameter, 
0, nullptr., 
D3D12_ ROOT_SIGNATURE_FLAG ALLOW INPUT_ ASSEMBLER_ INPUT_LAYOUT); 











// 创建 一 个 具有 3 个 模 位 的 根 签名 ， 第 一 个 指向 常量 缓冲 区 ， 第 二 个 指向 含有 单个 着 色 需 资 
源 视图 的 描述 符 
// 表 ， 第 三 个 指向 含有 单个 无 序 访 问 视图 的 描述 符 表 
ComPtr<ID3DB1lob> serializedRootSig = nullptr; 
ComPptr<ID3DBlob> errorBlob = nullptr; 
HRESULT hr = D3D12SerializeRootSignature(&rootSigDesc, 
D3D_ROOT_SIGNATURE VERSION_ 1, 
serializedRootSig.GetAddressOf(), errorBlob.GetAddressOf()); 

















if(errorBlob != nullptr) 
{ 


: :OutputDebugStringA((char*)errorBlob->GetBufferpPointer()); 
ThrowIfFailed(hr); 


ThrowIfFailed(md3dDevice->CreateRootSignature( 
6， 


serializedRootSig->GetBufferPointer()， 
serializedRootSig->GetBufferSize()， 
IID_PPV_ARGS(mPostProcessRootSignature.GetAddressof() ))); 





这 个 根 签名 的 定义 为 : 根 参 数 槽 0 指向 一 个 常量 缓冲 区 、 根 参数 模 1 
指 回 一 个 SRV， 根 参数 模 2 指 同一 个 UAV。 本 ) 派 调用 开始 之 前 ， 我 们 
先 要 为 计算 着 色 器 绑 定 常量 数据 与 资源 描述 符 以 供 其 使 用 : 








cmdList->SetComputeRootSignature(rootSig); 


cmdList->SetComputeRoot32BitConstants(60, 1, &blurRadius, ©); 
cmdList->SetComputeRoot32BitConstants(60, (UINT)weights.size(), weights.dat 
a(), 1); 


cmdList->SetComputeRootDescriptorTable(1, mBlur8GpuSryv); 
cmdList->SetComputeRootDescriptorTable(2, mBlurlGpuUav); 


UINT numGroupsX = (UINT)ceilf(mWidth / 256.6f); 
cmdList->Dispatch(numGroupsX, mHeight, 1); 





13.3.3 ”利用 索引 对 纹理 进行 采样 


纹理 元 素 可 以 借助 2D 索 引 加 以 访问 。 在 13.2 节 定义 计算 着 色 器 中 ， 
我 们 基于 分 派 的 线程 ID 来 索引 纹理 〈 在 13.4 节 中 将 对 线程 ID 进行 讨 
华 ) 。 而 每 个 线程 都 要 被 指定 一 个 唯一 的 调度 ID 〈 调 度 标识 符 ) 。 


[numthreads(16, 16, 1)] 
void CS(int3 dispatchThreadID : SV_DispatchThreadID) 





{ 
// 对 两 个 纹理 中 横 纵 坐标 分 别 为 x<、y 处 的 纹 素 求 和 ， 并 将 结果 存 至 相应 的 gOutput 纹 厅 中 





gOutput[dispatchThreadID.xy] = 
gInputA[dispatchThreadID.xy] + 
gInputB[dispatchThreadID.xy]; 





假设 我 们 为 处 理 纹理 而 分 发 了 足够 多 的 线程 组 〈 即 利用 一 个 线程 来 
处 理 一 个 单独 的 纹 素 ) ， 那 么 这 上 段 代 人 码 会 将 两 个 纹理 图 像 的 对 应 数据 进 
行 累 加 ， 再 将 结果 存 于 纹理 gOutput 中 。 


系统 对 计算 着 色 占 中 的 索引 越界 行为 有 着 明确 的 定义 。 越 界 的 读 操 
作 总 是 返回 0， 而 癌 越界 处 写 入 数据 时 却 不 会 实际 执行 任何 操作 (no- 
ops) [Boyd08]。 





由 于 计算 着 色 器 运行 在 GPU 上 ， 因 此 便 可 以 将 它 作 为 访问 GPU 的 一 
般 工 具 ， 特 别 是 在 通过 纹理 过 滤 来 对 纹理 进行 采样 的 时 候 。 但 是 ， 这 个 
过 程 中 还 存在 两 点 问题 。 第 一 个 问题 是 ， 我 们 不 能 使 用 Sample 方 法 ， 
而 必须 采用 sampleLevel 方 法 。 与 Sample 相 比 ，SampleLevel 需 要 获 
取 第 三 个 额外 的 参数 ， 以 指定 纹理 的 mipmap 层 级 。0 表 示 mipmap 的 最 高 
级 别 ，1 是 第 二 级 ， 并 以 此 类 推 。 知 此 参数 存在 小 数 部 分 ， 则 该 小 数 将 
用 于 在 开局 mipmap 线 性 过 滤 的 两 个 mipmap 层 级 之 间 进 行 插值 。 至 于 
Sample 方 法 ， 它 会 根据 屏幕 上 纹理 所 窗 的 像素 数量 而 自动 选择 最 佳 的 
mipmap 层 级 。 因 为 计算 着 色 器 不 可 直接 参与 演 染 ， 它 便 无 法 知 
道 Sample 方 法 自行 选择 的 mipmap 层 级 ， 所 以 我 们 必须 在 计算 着 色 器 中 
以 SampleLevel 方 法 来 显 式 ( 手 动 ) 指定 mipmap 的 层级 。 第 二 个 问题 
是 ， 当 我 们 对 纹理 进行 采样 时 ， 会 使 用 范围 为 0, 中 的 归 一 化 纹理 华 


























标 ， 。 此 时 ， 我 们 便 可 以 将 纹理 的 大 小 (width，height) 
《 即 纹理 的 宽度 与 高 度 ) 设置 为 一 个 常量 缓冲 区 变量 ， 再 利用 整数 索引 
(z,y) 来 求 取 归 一 化 纹理 坐标 : 


I 

width 
vy 

height 








下 列 代码 展示 了 一 个 使 用 整数 索引 的 计算 着 色 器 ， 而 第 二 个 功能 相 
同 的 版 本 则 采用 了 纹理 坐标 与 sampleLevel 函 数 。 这 里 我 们 假设 纹理 的 
大 小 为 512 x 512， 且 仪 使 用 最 高 的 mipmap 层 级 : 





// 
// 版 本 1: 使 用 整数 索引 


// 
cbuffer cbUpdateSettings 
{ 
float gWaveConstantg6 ; 
float gWaveConstant1; 
float gWaveConstant2; 
float gDisturbMag; 
int2 gDisturbIndex; 
}; 


RWTexture2D<float> gPrevSolInput : register(u6) ; 
RWTexture2D<float> gCurrSolInput : register(u1); 
RWTexture2D<float> gOutput : register(u2); 


[numthreads(16, 16, 1)] 
void CS(int3 dispatchThreadID : SV_DispatchThreadID) 
{ 
int x 
int y 


= dispatchThreadID.x; 
= dispatchThreadID.y; 
gOutput[int2(x,y)] 
gWaveConstant0 
gWaveConstant1 
gWaveConstant2 


gPrevSolInput[int2(x,y)].r + 
gCurrSolInput[int2(x,y)].r + 
( 


其 美 关中 


gCurrSolInput[int2(x,y+1)].r + 

gCurrSolInput[int2(x,y-1)].r + 

gCurrSolInput[int2(x+1l,y)].r + 

gCurrSolInput[int2(x-1,y)].r); 
} 




















// 
// 版 本 2: 使 用 函数 SampleLevel 与 纹理 坐标 


// 
cbuffer cbUpdateSettings 
{ 
float gWaveConstant6 ; 
float gWaveConstant1; 
float gwWaveConstant2 
float gDisturbMag; 
int2 gDisturbIndex; 
}; 


SamplerState samPoint : register(s6) 


RWTexture2D<float> gPrevSolInput : register(u6) ; 
RWTexture2D<float> gCurrSolInput : register(u1); 
RWTexture2D<float> gOutput : register(u2); 


[numthreads(16, 16, 1)] 
void CS(int3 dispatchThreadID : SV_DispatchThreadID) 
{ 

// 相当 于 以 SampleLevel() 取 代 运 算 符 [] 

int x = dispatchThreadID.x; 

int y = dispatchThreadID.y; 








float2 c = float2(x,y)/512.6f; 
float2 七 = float2(x,y-1)/512.0; 
float2 b = float2(x,y+1)/512.6; 
float2 1 = float2(x-1,y)/512.6; 
float2 r = float2(x+1,y)/512.6; 


gNextSolOutput[int2(x,y)] = 
gNaveConstants6erkgPrevSolInput.SampleLevel(samPoint，Cc，68.6f).r + 
gNaveConstants1kgCurrSolInput.Samp1leLevel(samPoint，Cc，68.6f).PF + 
gWaveConstants2*( 
gCurrSolInput.SampleLevel(sampoint, b, 8.6f).r + 
gCurrSolInput.SampleLevel(sampoint, t, 868.6f).r + 
gCurrSolInput.SampleLevel(sampoint, r, 68.6f).r + 
gCurrSolInput.SampleLevel(sampoint, 1, 8.6f).r); 





13.3.4 结构 化 绥 冲 区 资源 





以 下 示例 展示 了 如 何 通 过 HLSL 来 定义 结构 化 缓冲 区 (structured 
buffer) : 


struct Data 
{ 
float3 v1; 
float2 v2; 
}; 


StructuredBuffer<Data> gInputA : register(to) ; 
StructuredBuffer<Data> gInputB : register(t1); 
RWStructuredBuffer<Data> gOutput : register(u6) ; 





结构 化 缓冲 区 是 一 种 由 相同 类 型 元 系 所 构成 的 简单 缓冲 区 一 一 其 本 
质 上 是 一 种 数组 。 正 如 我 们 所 看 到 的 ， 该 元 素 类 型 可 以 是 用 户 以 HLSL 
定义 的 结构 体 。 


我 们 可 以 把 为 顶点 缓冲 区 与 索引 缓冲 区 创建 SRV 的 方法 同样 用 于 创 
建 结构 化 缓冲 区 的 SRV。 除 了 “必须 指定 
D3D12_RESOURCE_FLAG_ALLOWN_UNORDERED_ACCESS 标 志 ” 这 一 条 之 
外 ， 将 结构 化 缓冲 区 用 作 UAV 也 与 之 前 的 操作 基本 一 致 。 设 置 此 标志 的 
目的 是 用 于 把 资源 转换 
为 D3D12_RESOURCE_STATE_UNORDERED_ACCESS 状 态 。 





struct Data 


XMFLOAT3 v1; 
XMFLOAT2 v2; 
}; 





// 生成 一 些 数据 来 填充 SRV 绥 冲 区 
std: :vector<Data> dataA(NumDataElements); 
std: :vector<Data> dataB(NumDataElements); 
for(int i = 6; i «< NumDataElements; ++i) 
{ 
dataA[i].v1 
dataA[i].v2 

















XMFLOAT3(i, i, i); 
XMFLOAT2(i, 0); 


dataB[i].v1 = XMFLOAT3(-i, i, 6.6f); 
dataB[i].v2 = XMFLOAT2(@, -i); 
} 


UINT64 byteSize = dataA.size()*sizeof(Data); 








// 创建 若干 缓冲 区 用 作 SRV 
mInputBufferA = d3dUtil: :CreateDefau1ltBuffer( 
md3dDevice.Get()， 
mCommandList.Get()， 
dataA.data()， 
byteSize， 
mInputUploadBufferA); 


mInputBufferB = d3dUtil::CreateDefaultBuffer( 
md3dDevice.Get()， 
mCommandList.Get()， 
dataB.data()， 
byteSize， 
mInputUploadBufferB); 





























// 创建 用 作 UAV 的 缓冲 区 
ThrowIfFailed(md3dDevice->CreateCommittedResource( 
&CD3DX12_ HEAP_ PROPERTIES(D3D12 HEAP TYPE_DEFAULT), 
D3D12_HEAP_FLAG NONE, 
&CD3DX12 RESOURCE_ DESC: :Buffer(byteSize, 
D3D12 RESOURCE FLAG ALLOW UNORDERED ACCESS), 
D3D12 RESOURCE_ STATE UNORDERED ACCESS, 
nullptr, 
IID_ PPV_ARGS(&mOutputBuffer))); 





结构 化 缓冲 区 可 以 像 纹理 那样 与 流水 线 相 绑 定 。 我 们 为 它们 创建 
SRV 或 UAV 的 描述 符 ， 再 将 这 些 描述 符 作为 参数 传 入 需要 获取 描述 符 表 
的 根 参数 。 或 者 ， 我 们 还 能 定义 以 根 描述 符 为 参数 的 根 签名 ， 由 此 便 可 


以 将 资源 的 虚拟 地 址 作为 根 参 数 直接 进行 传递 ， 而 无 须 涉及 描述 符 扒 
(这 种 方式 仅 限 于 创建 缓冲 区 资源 的 SRV 或 UAV， 并 不 适用 于 纹理 ) 。 
考虑 下 列 的 根 签名 描述 : 














// 根 参 数 可 以 是 描述 符 表 、 根 捅 述 符 或 根 常 量 
CD3DX12 ROOT_ PARAMETER slotRootParameter[3]; 












































/ 性 能 优化 小 提示 : 按 变 更 频率 由 高 到 低 的 顺序 来 填充 根 参数 
slLotRootParameter[6].InitAsshaderResourceView(6) 
slotRootParameter[1].InitAsShaderResourceView(1); 
slotRootPparameter[2].InitAsUnorderedAccessView(0); 











// 根 签名 由 一 系列 根 参 数 所 构成 

CD3DX12_ ROOT_SIGNATURE DESC rootSigDesc(3, slotRootPparameter, 
606, nullptr., 
D3D12_ ROOT_SIGNATURE_FLAG_ NONE); 

















接 下 来 ， 我 们 就 能 绑 定 所 创建 的 缓冲 区 以 供 分 派 调用 使 用 : 


mCommandList->SetComputeRootSignature(mRootSignature.Get()); 


mCommandList->SetComputeRootShaderResourceView(®, 
mInputBufferA->GetGPUVirtualAddress()); 
mCommandList->SetComputeRootShaderResourceView(1, 


mInputBufferB->GetGPUVirtualAddress()); 
mCommandList->SetComputeRootUnorderedAccessView(2, 
mOutputBuffer->GetGPUVirtualAddress()); 


mCommandList->Dispatch(1, 1, 1); 





还 有 一 种 名 为 原始 缓冲 区 (raw buffer) 的 资源 ， 从 本 质 上 来 讲 ， 
它 是 用 字 节 数组 来 表示 数据 的 。 我 们 可 以 通过 字 节 偏 移 量 来 找到 所 需 数 
据 的 位 置 ， 再 将 它 按 适 当 的 类 型 进行 强制 转换 以 获取 数据 。 对 于 有 多 种 








不 同类 型 的 数据 存 于 同一 绥 冲 区 的 情况 来 说 ， 这 种 资源 可 谓 是 一 股 清流 
啊 ! 要 创建 原始 缓冲 区 资源 ， 必 须 用 DXGI_FORMAT_R32_TYPELESS 的 格 
式 ， 而 在 创建 对 应 的 UAV 时 一 定 要 使 用 D3D12_BUFFER_UAV_FLAG_RAW 
标志 。 本 书 中 不 会 使 用 这 种 原始 缓冲 区 资源 ， 读 者 知 需 了 解 更 多 细节 ， 

可 参考 SDK 文 档 。 


将 计算 大 色 占 的 执行 结果 复制 到 系统 内 
了 


一 般 来 说， 在 用 计算 着 色 器 对 纹理 进行 处 理 之 后 ， 我 们 就 会 将 结 
在 屏幕 上 显示 出 来 ， 并 根据 呈现 的 效果 来 验证 计算 肴 色 器 的 准确 性 
Caccuracy) 。 但 是 ， 如 果 使 用 结构 化 缓冲 区 参与 运算 ， 或 使 用 GPGPU 
进行 通用 计算 ， 则 运算 结 末 可 能 根本 就 无 法 显示 出 来 。 所 以 当前 的 燃 眉 
之 急 是 如 何 将 GPU 端 显存 〈 您 是 否 还 记得 ， 在 通过 UAV 回 结构 化 缓冲 区 
写 入 数据 时 ， 绥 冲 区 其 实 是 位 于 显存 之 中 ) 里 的 运算 结果 回 传 至 系统 内 
存 中 。 首 先 ， 应 以 堆 属性 D3D12_ HEAP_TYPE_READBACK 来 创建 系统 内 存 
缓冲 区 ， 再 通过 ID3D12GraphicsCommandList: :CopyResource 方 法 
将 GPU 资源 复制 到 系统 内 存 资源 之 中 。 其 次 ， 系 统 内 存 资源 必须 与 待 复 
制 的 资源 有 痢 相 同 的 类 型 与 大 小 。 最 后 ， 还 需 用 映射 API 函 数 对 系统 内 
存 缓冲 区 进行 映射 ， 使 CPU 可 以 顺利 地 读 取 其 中 的 数据 。 至 此 ， 我 们 融 
能 将 数据 复制 到 系统 内 存 块 中 了 ， 可 令 CPU 端 对 其 开展 后 续 的 处 理 ， 或 
存 数据 于 文件 ， 或 执行 所 需 的 各 种 操作 。 





本 章 包 含 了 一 个 名 为 “VecAdd” 的 结构 化 绥 冲 区 沽 示 程 序 ， 它 的 功 
能 比较 简单 ， 就 是 将 分 别 存 于 两 个 结构 化 缓冲 区 中 辣 量 的 对 应 分 量 进行 
求 和 运算 : 





struct Data 
{ 
float3 vi1; 
float2 v2; 
}; 


StructuredBuffer<Data> gInputA : register(t0); 
StructuredBuffer<Data> gInputB : register(t1); 


RWStructuredBuffer<Data> gOutput : register(u6) ; 


[numthreads(32，1，1)] 
void CS(int3 dtid : SV DispatchThreadID) 


gOutput[dtid.x].v1 
gOutput[dtid.x].v2 
} 


gInputA[dtid.x] .v1i + gInputB[dtid.x].vi1; 
gInputA[dtid.x] .v2 + gInputB[dtid.x].v2; 





为 了 方便 起 见 ， 我 们 使 每 个 结构 化 缓冲 区 中 仅 含 有 32 个 元 素 。 因 
此 ， 只 需 分 派 一 个 线程 组 即 可 《因为 一 个 线程 组 即 可 同时 处 理 32 个 数据 
元 素 ) 。 待 程序 中 的 所 有 线程 都 完成 计算 着 色 需 的 运算 任务 之 后 ， 我 们 
将 结果 复制 到 系统 内 存 ， 再 保存 于 文件 当中 。 下 面 的 代码 演示 了 如 何 创 
建 系统 内 存 缓冲 区 ， 以 及 怎样 将 GPU 中 的 计算 结果 复制 到 CPU 的 内 存 : 














// 创建 一 个 系统 内 存 缓冲 区 ， 以 便 读 回 处 理 结果 
ThrowIfFailed(md3dDevice->CreateCommittedResource( 
&CD3DX12_ HEAP_ PROPERTIES(D3D12 HEAP_ TYPE_ READBACK), 
D3D12_HEAP_FLAG NONE, 
&CD3DX12 RESOURCE_ DESC: :Buffer(byteSize)， 
D3D12 RESOURCE_ STATE _ COPY_DEST, 
nullptr, 
IID_PPV_ARGS(&mReadBackBuffer))); 





A 
// 





// 计算 着 色 器 执行 完毕 





struct Data 

{ 
XMFLOAT3 v1; 
XMFLOAT2 v2; 


}; 


// 按 计 划 将 数据 从 默认 缓冲 区 复制 到 回 读 缓冲 区 《〈 即 系统 内 存 缓冲 区 ) 中 
mCommandList->ResourceBarrier(1, &CD3DX12 RESOURCE BARRIER::Transition( 
mOutputBuffer.Get(), 
D3D12 RESOURCE STATE _ COMMON, 
D3D12 RESOURCE STATE COPY_ SOURCE)); 











mCommandList->CopyResource(mReadBackBuffer.Get(), mOutputBuffer.Get()); 


mCommandList->ResourceBarrier(1, &CD3DX12 RESOURCE BARRIER::Transition( 
mOutputBuffer.Get(), 
D3D12 RESOURCE STATE COPY_ SOURCE, 
D3D12_ RESOURCE STATE COMMON)); 


// 命令 记录 完成 
ThrowIfFailed(mCommandList->Close() ); 





// 将 命令 列表 添加 到 命令 队列 中 用 于 执行 
ID3D12CommandList* cmdsLists[] = { mCommandList.Get() }; 
mCommandQueue->ExecuteCommandLists( countof(cmdsLists), cmdsLists); 














// 等 待命 令 执行 完毕 
FlushCommandQueue(); 

















// 对 数据 进行 映射 ， 以 便 CPU 读 取 

Data* mappedData = nullptr; 

ThrowIfFailed(mReadBackBuffer->Map(8@, nullptr, 
reinterpret cast<void**>(&mappedData))); 


std: :ofstream fout("results.txt"); 


for(int i = 6; i < NumDataElements; ++i) 
{ 
fout << "(" << mappedData[i].vi.x << ", " << 
mappedData[i].vi.y << ”， << 
mappedData[i].vi.z << "， << 
mappedData[i].v2.x 《< << 
mappedData[i].v2.y << ")" «<< std::endl; 


.> 


} 


mReadBackBuffer->Unmap(8@, nullptr); 





在 这 个 省 示 程序 中 ， 我 们 用 下 列 初始 数据 来 填写 两 个 输入 缓冲 区 : 


std: :vector<Data> dataA(NumDataElements); 
std: :vector<Data> dataB(NumDataElements); 
for(int i = 6; i «< NumDataElements; ++i) 


{ 
dataA[i].v1 = XMFLOAT3(i, i, i); 


dataA[i].v2 = XMFLOAT2(i, 0); 


dataB[i].v1 = XMFLOAT3(-i, i, 6.6f); 
dataB[i].v2 = XMFLOAT2(@,， -i); 





存 有 计算 结果 的 文本 文件 应 含有 下 列 数据 ， 据 此 我 们 便 能 确定 计算 
着 色 器 是 否 按 预期 完成 任务 : 





(0, 8, 6, 0, 0) 

(©, 2， 1, 1， -1) 
(©, 4， 2， 2， -2) 
(8， 6， 3， 3， -3) 
(8， 8， 4， 4， -4) 
(6, 10, 5, 5, -5) 
(06, 12, 6, 6, -6) 
(06, 14, 7, 7, -7) 
(0, 16, 8, 8, -8) 


(0, 18, 9, 9, -9) 

(86，26，16，16，-16) 
(86，22，11，11，-11) 
(86，24，12，12，-12) 
(86，26，13，13，-13) 
(0, 28, 14, 14, -14) 
(60, 30, 15, 15, -15) 
(60, 32, 16, 16， -16) 
(0, 34, 17, 17, -17) 
(0, 36, 18, 18, -18) 
(60, 38, 19, 19, -19) 
(86，46，286，26，-26) 
(0, 42, 21, 21, -21) 
(0, 44, 22,22，-22) 
(0, 46, 23, 23，,-23) 
(0, 48, 24, 24, -24) 
(0, 506, 25, 25, -25) 


(6，52，26，26，-26) 
(6，54，27，27，-27) 
(86，56，28，28，-28) 
(6，58，29，29，-29) 
(86，66，36，36，-36) 
(6，62，31，31，-31) 





观察 图 13.1 可 以 发 现 ，CPU 与 GPU 之 间 的 存储 器 复制 操作 最 为 组 
。 而 对 于 图 形 处 理 这 一 角度 来 说 ， 我 们 更 是 永远 都 不 想 在 每 一 帧 都 执 
行 这 种 复制 操作 ， 因 为 这 样 频繁 地 搬运 数据 对 程序 的 性 能 而 言 无 颖 是 毁 
灭 性 的 的 打击 。 有 读者 可 能 会 问 : 在 进行 GPGPU 编 程 的 过 程 中 ， 我 们 
可 是 常常 需要 将 运算 结果 返回 CPU 啊 ? 然而 ， 这 对 于 GPGPU 编 程 来 
说 ， 往 往 并 不 是 什么 大 难题 ， 因 为 GPU 运 算 所 节省 的 时 间 远 超 GPU 问 
CPU 复 制 所 花费 的 时 间 一 一 再 者 说 ， 针 对 GPGPU 编 程 而 言 ， 并 不 是 “每 
一 帧 ?都 要 执行 这 种 复制 操作 。 举 个 例子 ， 假 设 某 个 应 用 程序 要 通过 
GPGPU 编 程 来 实现 一 个 开销 极 大 的 图 形 处 理 计算 。 在 运算 结束 之 后 ， 
再 将 其 处 理 结果 复制 到 CPU。 在 这 种 情况 下 ，GPU 并 不 会 立即 开始 下 一 
次 处 理 ， 而 是 只 有 在 用 户 发 起 另 一 次 计算 请 求 时 ， 它 才 会 为 此 重新 开动 
起 来 。 











病 











13.4 ”线程 标识 的 系统 值 


考虑 图 13.4 中 所 示 的 线程 分 派 情况 
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图 13.4 考虑 图 中 标 出 的 线程 厂 ， 其 所 在 线程 组 的 ID 是 (1 1, 0)， 它 在 组 中 的 线程 ID 为 (2, 5, 0)。 
因此 ， 该 线程 的 调度 线程 ID 为 1， 1, 0) @ (8，8, 0) 十 {2,5, 0) = (10,13, 0), 而 它 在 
组 中 的 线程 ID 则 为 ? Xx 3 十 2 三 42 








系统 会 为 每 个 线程 组 都 分 配 一 个 ID， 这 个 ID 称 为 线程 组 
ID (group ID) ， 其 系统 值 的 语义 为 SV_GroupID。 如 果 Gz x Gy < 0: 为 
所 分 派 线程 组 的 个 数 ， 则 组 ID 的 范围 为 (0, 0, 0) 至 (Gz 一 1 Gy 一 1 G 一 


O 


2. 在 线程 组 中 ， 每 个 线程 都 被 指定 了 一 个 组 内 的 唯一 ID。 帮 线程 
组 的 规模 为 X x Y x Z, 则 组 内 线程 ID 〈group thread ID) 的 范围 实 为 (0， 
0, 0) 到 (六 一 1,Y 一 1,Z 一 1)。 组 内 线程 ID 系 统 值 的 语义 
为 SV_GroupThreadID。 


. 调用 一 次 Dispatch 函 数 便 会 分 派 一 个 线程 组 网 格 。 调 度 线程 
ID (dispatch thread ID， 分 派 线程 ID) 是 Dispatch 调 用 为 线程 所 生成 的 
唯一 标识 〈 相 对 于 所 有 的 线程 而 言 )》 。 换 名 话说， 组 内 线程 ID 是 线程 相 
对 于 所 在 线程 组 的 唯一 标识 (局 部 ) ， 而 调度 线程 ID 则 是 Dispatch 调 
用 为 线程 指定 的 相对 于 所 有 线程 组 中 全 部 线程 的 唯一 识别 信息 (全 
局 ) 。 今 设 线程 组 的 规模 为 ThreadGroupSize = (X,Y,Z)， 那 么 我 们 
便 可 以 根据 线程 组 ID 与 组 内 线程 ID， 通 过 以 下 方法 推算 出 调度 线程 ID: 


dispatchThreadID.xyz = groupID.xyz * ThreadGroupSize.xyz + 
groupThreadID.xyz; 


调度 线程 ID 的 系统 值 语义 为 SV_DispatchThreadID。 如 果 分 派 了 
一 个 大 小 为 3 x 2 的 线程 组 ， 且 其 中 每 个 线程 组 的 规模 为 10 x 10， 则 共 分 
发 了 600 个 线程 ， 而 且 所 调度 线程 的 ID 范围 为 (0, 0, 0) 至 (29, 19, 0)。 





4. 通过 Direct3D 的 系统 值 SV_GroupIndex 便 可 以 指定 组 内 线程 ID 
的 线性 索引 ， 它 的 换算 方法 为 : 


groupIndex = groupThreadID.z*ThreadGroupSize.x*ThreadGroupSize.y + 





groupThreadID.y*ThreadGroupSize.x + groupThreadID.x; 


至 于 坐标 的 索引 顺序 ， 其 第 一 个 坐标 指出 的 是 线程 在 z 方 同上 的 位 
置 eo hh 第 二 个 坐标 则 是 线程 在 y 方 向 上 的 位 置 《〈 或 
你 “ 行 ?>) 。 这 个 顺序 与 普通 矩阵 的 记 法 刚好 相反 ， 即 Mj 表示 算 阵 中 第 





行 、 第 7 列 的 那 一 个 元 素 。 





为 什么 需要 给 出 这 些 线程 ID 值 呢 ? 这 是 因为 计算 着 色 器 通常 会 以 知 
干 数据 结构 作为 输入 ， 再 将 计算 结果 输出 到 万 一 些 数 据 结构 之 中 。 而 我 
们 就 可 以 利用 这 些 线程 ID 值 来 对 这 些 数据 结构 进行 索引 : 


Texture2D gInputA; 
Texture2D 8gInputB ; 
RWTexture2D<float4> gOutput ; 


[numthreads(16, 16, 1)] 
void CS(int3 dispatchThreadID : SV_DispatchThreadID) 














// 通过 调度 线程 ID 来 索引 输入 与 输出 的 纹理 

gOutput[dispatchThreadID.xy] = 
gInputA[dispatchThreadID .xy] + 
gInputB[dispatchThreadID.xy]; 














利用 SV_GroupThreadID 系 统 值 即 可 极为 便利 地 对 线程 的 本 地 存储 
器 (local storage memory) 进行 索引 〈 人 参见 13.6 节 ) 。 


13.5 ”追加 绥 冲 区 与 消费 缓冲 区 
假设 我 们 通过 下 列 结构 体 定义 了 一 个 存 有 粒子 数据 的 缓冲 区 : 


struct Particle 


{ 


float3 Position; 


float3 Velocity; 
float3 Acceleration; 














并 且 和 希望 基于 粒子 的 速度 与 恒定 加 速度 在 计算 着 色 器 中 对 其 位 置 进 
行 更 新 。 此 外 ， 我 们 还 假定 不 必 考 虑 粒子 的 更 新 顺序 以 及 它们 被 写 入 输 
出 缓冲 区 的 顺序 。 消 费 结 构 化 绥 冲 区 (consume structured buffer， 一 种 
输入 缓冲 区 ) 与 追加 结构 化 缓冲 区 (append structured buffer， 一 种 输出 
缓冲 区 ) 便 是 为 这 种 场景 而 生 的 。 奋 使 用 了 这 两 种 缓冲 区 ， 我 们 也 就 不 
必 再 在 索引 问题 上 花心 思 





struct Particle 


{ 
float3 Position; 
float3 Velocity; 
float3 Acceleration; 
}; 


float TimeStep = 1.6f / 66.6f; 


ConsumeStructuredBuffer<Particle> gInput; 
AppendStructuredBuffer<Particle> gOutput; 
[numthreads(16, 16, 1)] 

void CS() 








// 对 输入 缓冲 区 中 的 数据 元 素 之 一 进行 处 理 ( 即 “消费 *?"， 从 缓冲 区 中 移 除 一 个 元 素 ) 
Particle p = gInput.Consume(); 











p.Velocity += p.Acceleration*TimeStep; 


p.Position += p.Velocity*TimeStep; 





// 将 规范 化 向 量 妃 加 到 输出 缓冲 区 
gOutput.Append( p ); 











数据 元 素 一 旦 经 过 处 理 ( 即 消费 ) ， 其 他 线程 就 不 能 再 对 它 进行 任 
何 操作 了 《事实 上 也 惑 是 从 消费 缓冲 区 中 移 除 掉 了 ) 。 而 且 ， 一 个 线程 
也 只 能 处 理 一 个 数据 元 素 。 除 此 之 外 ， 我 们 无 法 知晓 数据 元 素 的 具体 处 
理 顺 序 与 退 加 顺序 。 因 此 ， 一 般 来 说 ， 某 元 素 位 于 输入 绥 冲 区 的 位 置 与 
其 处 理 后 写 入 输出 缓冲 区 的 位 置 〈《 两 种 缓冲 区 中 相同 元 素 的 排列 顺序 ) 


并 不 是 一 一 对 应 的 。 








妃 加 结构 化 缓冲 区 的 空间 是 不 能 动态 扩展 的 。 但 是 ， 它 们 一 定 有 足 
够 的 空间 来 容纳 我 们 要 问 其 退 加 的 所 有 元 素 。 





13.6 ”共享 内 存 与 线程 同步 


每 个 线程 组 都 有 一 块 称 为 共享 内 存 (shared memory) 或 线程 本 地 存 
储 器 (thread local storage) 的 内 存 空间 。 这 种 内 存 的 访问 速度 很 快 ， 可 
认为 与 硬件 高 速 缓存 的 速度 不 相 上 下 。 在 我 们 的 计算 着 色 器 的 代码 中 ， 
共享 内 存 的 声明 如 下 : 


groupshared float4 gCache[256]; 


数组 大 小 可 依 用 户 的 需求 而 定 ， 但 是 线程 组 共享 内 存 的 上 限 为 32 
kb。 由 于 共享 内 存 是 线程 组 里 的 本 地 内 存 ， 所 以 要 通过 
SV_GroupThreadID 语 义 对 它 进 行 索引 。 据 此 ， 我 们 可 以 使 组 内 的 每 个 
线程 都 来 访问 共享 内 存 中 的 同一 个 元 素 。 

















使 用 过 多 的 共享 内 存 会 引发 性 能 问题 [Fung10]， 下 面 给 出 例子 对 此 
进行 详解 。 假 设 现 有 一 款 最 多 支持 32 KBI6 共 享 内 存 的 多 处 理 器 ， 而 用 
户 的 计算 着 色 器 则 需要 共享 内 存 20 KB。 这 意味 着 只 有 为 每 个 多 处 理 器 
设置 一 个 线程 组 才能 满足 此 限制 ， 因 为 20 KB + 20 KB = 40 KB > 32 
KB， 上 所 以 没有 足够 的 共享 内 存 供 另 一 个 线程 组 使 用 [Fung10]。 这 样 一 来 
就 限制 了 GPU 的 并 发 性 ， 因 为 多 处 理 器 将 无 法 在 多 个 线程 组 之 间 进 行 切 
换 而 屏蔽 处 理 过 程 中 的 延迟 〈13.1 节 中 曾 提 到 ， 建 议 每 个 多 处 理 器 至 少 
设 有 两 个 线程 组 ) 。 因 此 ， 即 使 这 款 硬件 在 技术 上 仅 文 持 32 KB 的 共享 
内 存 ， 但 是 通过 缩减 内 存 的 使 用 量 却 能 令 其 性 能 得 到 优化 。 























共 至 内 存 第 见 的 应 用 场景 是 存储 纹理 数据 。 在 特定 的 算法 中 ， 例 如 


像 模 糊 图 像 (blur) 这 种 工作 ， 就 需要 对 同一 个 纹 素 进行 多 次 拾取 。 纹 
理 采 样 实际 上 是 一 种 速度 较 慢 的 GPU 操作 ， 因 为 内 存 融 宽 与 内 存 延 迟 还 
未 能 像 GPU 的 计算 能 力 那 样 得 到 极 大 的 改善 [Moller08]。 但 是 ， 我 们 可 
以 将 线程 组 所 需 的 纹理 样本 全 部 预 加 载 至 共享 内 存 块 ， 以 此 来 避免 密集 
的 纹理 拾取 操作 所 带 来 的 性 能 下 滑 。 接 下 来 ， 算 法 流程 便 会 在 共享 内 存 
块 中 查找 纹理 样本 并 进行 处 理 ， 此 时 的 处 理 速 度 就 很 快 了 。 现 假设 我 们 
以 下 列 有 误 的 代码 来 实现 上 述 方案 : 





Texture2D gInput; 
RWTexture2D<float4> gOutput; 


groupshared float4 gCache[256]; 


[numthreads(256, 1, 1)] 
void CS(int3 groupThreadID : SV_GroupThreadID, 
int3 dispatchThreadID : SV_DispatchThreadID) 
{ 
// 每 个 线程 都 采集 纹理 ， 并 将 条 得 的 数据 存 于 共享 内 存 中 
gCache[groupThreadID.x] = gInput[dispatchThreadID.xy]; 


















































// 接 下 来 执行 的 计算 任务 : 访问 其 他 线程 在 共享 内 存 中 存储 的 数据 元 素 






































// 糟糕 ! ! ! 采集 左 、 右 相 邻 纹 素 的 这 两 条 线程 可 能 还 没有 完成 纹理 采样 ， 并 且 还 未 将 结 
果 存 

// 于 共享 内 存 中 

float4 left = gCache[groupThreadID.x - 1]; 

float4 right = gCache[groupThreadID.x + 1]; 





有 一 个 问题 随 之 而 来 ， 根 源 在 于 我 们 无 法 保证 线程 组 内 的 所 有 线程 
都 能 同时 完成 任务 。 这 可 能 会 导致 线程 访问 到 还 未 经 初始 化 的 共享 内 存 
元 素 ， 因 为 负 员 将 这 些 元 系 进 行 初 始 化 的 相 邻 线程 也 许 还 没有 完成 它 的 
本 职工 作 。 要 填 上 这 个 坑 ， 就 一 定 要 先 等 得 所 有 的 线程 痢 将 各 上 自 所 处 理 





的 纹理 加 载 到 共享 内 存 之 中 ， 而 后 再 令 计算 着 色 器 继续 后 面 的 工作 。 这 
时 束 轮 到 同步 命令 内 腕 登场 了 : 





Texture2D gInput; 
RWTexture2D<float4> gOutput; 


groupshared float4 gCache[256]; 


[numthreads(256, 1, 1)] 
void CS(int3 groupThreadID : SV_GroupThreadID, 
int3 dispatchThreadID : SV_DispatchThreadID) 


{ 



































// 每 个 线程 都 对 纹理 进行 采样 ， 再 将 采集 数据 存储 在 共享 内 存 ， 
gCache[groupThreadID.x] = gInput[dispatchThreadID .xy]; 



































// 等 待 组 内 的 所 有 线程 都 完成 各 自 的 任务 
GroupMemoryBarrierWithGroupSync(); 




















// 此 时 ， 读 取 共 享 内 存 的 任意 元 素 并 执行 计算 任务 都 是 安全 的 
float4 left = gCache[groupThreadID.x - 1]; 
float4 right = gCache[groupThreadID.x + 1]; 








13.7 ”图像 模糊 演示 程序 


在 本 节 中 ， 我 们 将 解释 如 何 通 过 计算 着 色 器 来 实现 令 图 像 模 糊 的 算 
法 。 首 先 叙 述 模糊 算法 的 数学 原理 。 其 次 ， 讨 论 泻 染 到 纹理 技术 
Crender-to-texture) ， 我 们 的 例 程 以 此 来 生成 用 于 模糊 处 理 的 源 图 像 。 
最 后 审阅 计算 着 色 器 的 实现 代码 ， 并 探讨 如 何 来 实现 那些 棘手 的 功能 细 


二 上 - 


让。 
13.7.1 图 像 模 糊 理论 


可 将 图 像 的 模糊 算法 描述 如 下 : 针对 源 图 像 中 的 每 一 个 像素 往 ， 计 
算 以 它 为 中 心 的 m x n 和 矩阵 的 加 权 平 均值 〈( 见 图 13.5〉 。 此 加 权 平 均值 便 
古 经 模糊 处 理 后 图 像 中 第 : 行 、 第 ] 列 的 像素 磊 色 。 用 数学 公式 来 表示 即 


其 中 ，m = 24a +1 有 n= 2b+1。 将 m 与 n 强 制 为 奇数 ， 以 此 来 保证 
m xn 和 矩阵 总 是 上 有 具有“ 中心” 项。 我 们 称 a 为 垂直 模糊 半径 ，b 为 水 平 模糊 半 
径 。 大 ac =b， 则 只 需 指定 模糊 半径 (blur radius〉 即 可 确定 矩阵 的 大 
小 。m x n 权 值 矩 阵 称 为 模糊 核 (blur kemel， 也 有 译作 模糊 内 核 ) 。 从 
公式 中 还 可 以 看 出 ， 权 值 之 和 必 为 1。 如 果 权 值 和 小 于 1， 则 模糊 后 的 图 
像 将 随 着 颜色 的 缺失 而 显得 更 暗 ; 如 果 权 值 之 和 大 于 1， 则 模糊 处 理 后 








的 图 像 会 随 着 颜色 的 增添 而 更 显明 亮 。 


在 保证 权 值 和 为 1 的 前 提 下 ， 我 们 就 能 用 多 种 不 同 的 方法 来 计算 
它 。 在 大 多 数 图 像 编辑 软件 中 ， 我 们 能 发 现 一 种 广为人知 的 模糊 运算 : 


高 斯 模糊 (Gaussian blur) 。 此 算法 借助 高 斯 函数 A 由 
获取 权 值 。 图 13.6 展 示 了 取 不 同 c 值 时 高 斯 函数 的 对 应 图 像 。 


























参与 计算 模糊 的 像素 








图 13.5 ”为 了 对 像素 人 I 进 行 模糊 处 理 ， 我 们 就 要 计算 以 此 像素 为 中 心 的 m X 刀 像 素 矩阵 的 加 权 
平均 值 。 在 此 图 的 示例 中 ， 目 标 箱 阵 是 规模 为 3 x 3 的 方 阵 ， 模 糊 半径 为 4 二 b 二 1。 不 难看 
出 ， 权 值 矩 阵 中 心 元 素 的 权重 Wo 对 应 于 像素 三 





























图 13.6 当 5 = 1，2， 3 时， 函数 G(T) 的 图 像 。 可 以 发 现 ， 若 o 越 大 ， 则 曲线 越 趋 于 平缓 ， 给 
邻近 点 所 赋予 的 权 值 也 就 越 大 





现 假设 我 们 要 进行 规模 为 1 x 5 的 高 斯 模糊 《〈 即 在 水 平方 向 上 进行 1D 
模糊 ) ， 且 设 o = 1。 分 别 对 z = 一 2, 一 1,0,1,2 求 取 G(7) 的 值 ， 我 们 有 : 











/ 2 
1)? 
G(1) = exp (9 ) =e-3 





但 是 ， 这 些 数据 还 不 是 最 终 的 权 值 ， 因 为 它们 的 和 不 为 1: 


>》, G(z) = G(-2) +G(-1 + G(0) + G(1) + G(2) 
一 一 人 

=1+2e ?+2e? 

~ 2.48373 


3 CT 
如 果 将 上 式 除 Be 来 对 它 进行 规范 化 处 理 ， 那 么 我 们 便 会 
基于 高 斯 函数 获得 总 和 为 1 的 诸 权 值 : 


G(—2)+G(—1+G(0)+G(1)+G(2) 








一 - = 1 

2z=-2 G(T) 

因此 ， 所 求 高 斯 模糊 的 权重 分 别 为 : 
G(—2) e i 
W_2 = 一 二 7 — 0.0545 

Dr GT) 1+2e ?+2e? 
G(-1) e-3 

一 一 ~ 0.2442 














GI(0) ] ee 

WA 一 二 - ~ 0.4026 
> —2 GI{(Z) 1 -一 Ms sh De —2 

G(1) e-3 

9 a 一 - ~ 0.2442 
人 CTj 1 十 2e 2 十 2e- 

G(2) e 

02 一 7 CT 一 ~ ~ 0.0545 
D7 9G(T) 1+2e ?+2e 


高 斯 模糊 最 著名 的 莫 过 于 它 的 可 分 离 性 (separable〉， 根 据 这 条 性 
质 ， 我 们 可 以 像 下 面 那 样 将 它 分 为 两 个 1D 模 糊 过 程 。 


1. 通过 1D 横 加 模糊 (horizontal blur) 将 输入 的 图 像 7 进 行 模 糊 处 
理 . Tp = Blurp(1), 


2 对 上 一 步 输出 的 结果 再 次 进行 1D 纵 向 模糊 (vertical blur) 处 
理 . Blur(1T) = Blurv(Ip), 


对 公式 化 简 一 番 ， 我 们 便 得 到 : 
Blur(T) = Blurvy(Bhurp!(71)) 


假设 模糊 核 为 一 个 9 x 9 矩阵， 我 们 就 需要 对 忌 计 81 个 样本 依次 执行 
2D 模 糊 计 算 。 但 通过 将 模糊 过 程 分 离 为 两 个 1D 模 糊 阶 段 ， 便 仪 需 处 理 9 
+9= 18 个 样本 ! 我 们 常常 要 对 纹理 进行 模糊 处 理 ， 而 本 半 中 也 提 到 
过 : 拾取 纹理 样本 是 代价 高 昂 的 操作 。 因 此 ， 通 过 分 离 模糊 过 程 来 减少 
纹理 采样 操作 是 一 种 受用 户 欢 迎 的 优化 手段 。 尽 管 有 些 模糊 方法 不 具 分 
离 性 “ 即 茶 些 模糊 算 子 不 可 实现 分 离 模 糊 过 程 ) ， 但 只 要 保证 最 终 图 像 
在 视觉 上 足够 精准 ， 我 们 往往 还 是 能 以 优化 性 能 为 目的 而 简化 其 模糊 过 


程 。 








13.7.2 ” 泻 染 到 纹理 技术 








到 现在 为 止 ， 我 们 一 直 都 在 程序 中 辐 后 台 绥 冲 区 演 染 数据 。 但 是 ， 
后 台 绥 冲 区 到 底 是 怎样 的 一 种 存在 呢 ? 如 果 查 阅 了 D3DApp 部 分 的 代 
码 ， 我 们 便 会 发 现 ， 后 台 绥 冲 区 其 实 就 是 一 种 位 于 交换 链 中 的 纹理 : 





Microsoft: :NRL: :ComPtr<ID3D12Resource> mSwapChainBuffer[SwapChainBufferCou 
nt ] ; 
CD3DX12 CPU DESCRIPTOR HANDLE rtvHeapHandle(mRtvHeap-> 


GetCPUDescriptorHandleForHeapStart()); 
for (UINT i = 6;j i «< SwapChainBufferCount; i++) 


ThrowIfFailed(mSwapChain->GetBuffer(i, 
IID_ PPV_ARGS(&mSwapChainBuffer[i]))); 
md3dDevice->CreateRenderTargetView( 
mSwapChainBuffer[i].Get(), nullptr, rtvHeapHandle); 
rtvHeapHandle.Offset(1, mRtvDescriptorSize); 
} 





通过 将 后 台 绥 冲 区 的 泻 染 目标 视图 与 演 染 流水 线 的 输出 合并 
(Output Merger，OM) 阶段 相 绑 定 ， 使 Direct3D 将 数据 泻 染 至 后 台 绥 
冲 区 中 : 


// 指定 即将 被 泻 染 的 缓冲 区 


mCommandList->OMSetRenderTargets(1, &CurrentBackBufferView(), 
true, &DepthStencilView()); 





在 通过 IDXGISwapChain: :Present 方 法 呈现 后 台 绥 冲 区 时 ， 其 中 
的 数据 便 会 显示 在 屏幕 上 。 


注意 Note We 


用 作 演 染 目 标的 纹理 一 定 要 以 
D3D12_RESOURCE_FLAG _ALLOW_RENDER_TARGET 标 志 来 创建 。 





如 末 认 真 分 析 这 些 代码 便 会 发 现 ， 我 们 还 可 以 畅通 无 阻 地 创建 太一 
个 纹理 ， 再 为 它 创 建 泻 染 目标 视图 ， 并 将 它 绑 定 到 泻 染 流水 线 的 OM 阶 
段 之 上 。 由 此 ， 我 们 就 能 改 将 数据 〈 可 能 还 要 使 用 不 同 的 摄像 机 视角 ) 





绘制 到 这 种 全 然 不 同 的 “ 离 屏 ”(off-screen) 纹理 之 中 ， 而 非 后 台 组 冲 区 
之 内 。 这 种 就 是 著名 的 渔 染 到 高 屏 纹理 (render-to-off-screen-texture) 
技术 ， 简 称 泻 染 到 纹理 (render-to-texture) 。 这 种 纹理 与 后 台 组 冲 区 的 
唯一 不 同 之 处 在 于 : 在 执行 提交 操作 〈present， 亦 有 作 呈 现 ) 的 过 程 
中 ， 它 无 法 显示 在 屏幕 上 。 











根据 以 上 叙述 来 看 ， 演 染 到 纹理 给 人 的 第 一 感 党 很 可 能 就 是 “一 无 
是 处 ?， 因 为 它 压根 就 没 法 把 纹理 直接 显示 到 屏幕 上 。 但 是 ， 在 演 染 到 
纹理 执行 完毕 之 后 ， 我 们 还 可 以 将 后 台 绥 冲 区 重新 绑 定 到 OM 阶 段 ， 从 
而 继续 将 几何 图 形 绘制 到 后 台 绥 冲 区 之 中 。 不 仅 如 此 ， 关 键 在 于 我 们 还 
能 够 用 演 染 到 纹理 期 间 所 生成 的 纹理 为 几何 体贴 图 。 利 用 这 个 策略 便 可 
实现 各 种 特殊 的 效果 。 例 如 ， 我 们 可 以 通过 泻 染 到 纹理 技术 把 乌 虞 视图 
绘制 到 场景 纹理 之 上 。 也 就 是 说 ， 在 癌 后 台 绥 冲 区 绘制 数据 的 过 程 中 ， 
我 们 可 以 借 此 将 乌 虞 图 泻 染 到 屏 医 右 下 角 的 一 个 小 方 框 中 ， 以 此 来 模拟 
雷达 系统 〈 见 图 13.7) 。 泻 染 到 纹理 的 用 武之 地 还 有 : 








图 13.7 ”利用 一 个 位 于 玩家 上 方 的 摄像 机 以 乌 敬 图 的 视角 将 场景 泻 染 至 一 个 离 屏 纹理 之 中 。 在 
把 场景 以 玩家 视角 绘 至 后 台 缓 冲 区 的 时 候 ， 我 们 将 上 述 离 屏 纹 理 演 染 至 屏幕 右 下 角 的 方 框 之 











中 ， 以 此 来 显示 雷达 图 


1. 阴影 贴图 (shadow mapping) 。 





2. 屏幕 空间 环境 光 遮 丽 〈screen space ambient occlusion， 


SSAO) 。 
3. 动态 反射 与 立方 体 图 (dynamic reflections with cube maps) 。 


若 使 用 泻 染 到 纹理 技术 ， 则 在 GPU 上 实现 的 模糊 算法 将 以 如 下 方式 
工作 : 把 演示 程序 中 的 场景 按 寻 常 方 式 泻 染 到 离 屏 纹理 上 ， 该 纹理 会 被 
输入 至 计算 着 色 器 并 执行 模糊 算法 。 竺 纹理 经 模糊 处 理 后 ， 我 们 会 将 所 
得 的 纹理 绘制 为 全 屏 四 边 形 (full screen quad) 并 送 到 后 台 绥 冲 区 ， 由 
此 便 可 根据 模糊 效果 来 检验 模糊 的 实现 。 此 流程 的 关键 步骤 可 概括 如 
下 : 








1.， 像 往常 一 样 将 场景 绘制 到 一 个 离 屏 纹理 之 中 。 





2. 通过 计算 着 色 絮 程序 来 对 该 纹理 进行 模糊 处 理 。 


3. 将 后 台 绥 冲 区 恢复 为 泻 染 目 标 ， 并 以 模糊 后 的 纹理 来 绘制 全 屏 
四 边 形 。 








使 用 泻 染 到 纹理 技术 来 实现 模糊 效果 比较 受 帖 ， 而 且 在 需要 将 场景 
演 染 为 与 后 台 缓冲 区 大 小 不 同 的 纹理 中 时 ， 这 种 方法 也 是 理想 的 选择 。 
假设 离 屏 纹理 与 后 台 缓 冲 区 的 大 小 及 格式 相 匹配 ， 我 们 就 能 采用 间接 绘 
制 到 离 屏 纹理 的 方式 代 之 : 像 之 前 一 样 先 将 纹理 渔 染 全 后 台 绥 冲 区 ， 再 








把 后 台 绥 冲 区 的 内 容 用 CopyResource 方 法 复制 到 离 屏 纹 理 。 接 下 来 ， 
我 们 就 能 在 离 屏 纹理 上 开展 计算 工作 ， 再 将 模糊 后 的 纹理 绘制 为 全 屏 四 
边 形 送 至 后 台 组 冲 区 ， 以 生成 最 终 的 屏幕 输出 。 





// 将 input《〈 在 这 个 示例 中 它 是 后 台 绥 冲 区 资源 ) 复制 到 BlurMape。 








cmdList->CopyResource(mBJlLurMap6.Get()，input); 








以 上 就 是 实现 模糊 演示 程序 所 用 到 的 技术 。 在 练习 6 中 ， 我 们 将 通 
过 泻 染 到 纹理 技术 完成 妨 一 种 与 之 截然 不 同 的 过 小 占 。 


上 述 处 理 过 程 需要 先 用 普通 的 泻 染 流水 线 进行 绘制 ， 继 而 切换 到 计 
算 着 色 器 执行 计算 任务 ， 最 后 再 切换 回 普 通 的 演 染 流水 线 。 一 般 来 讲 ， 
我 们 应 当 尝 试 避免 在 演 染 与 计算 工作 之 间 的 往复 切换 行为 ,因为 上 下 文 
(context〉 的 切换 会 产生 开销 [NVIDIA10]。 在 每 一 帧 中 应 试 着 先 完成 所 
有 的 计算 工作 ， 再 执行 全 部 的 泻 染 任务 。 当 然 ， 这 有 时 是 无 法 实现 的 。 
例如 ， 在 上 述 处 理 过 程 中 ， 我 们 需要 先 把 场景 演 染 到 一 个 纹理 ， 使 它 在 
计算 着 色 器 中 进行 模糊 处 理 ， 然 后 将 处 理 的 结果 绘制 出 来 。 虽 然 不 能 完 
全 避免 切换 操作 ， 但 是 我 们 还 可 以 尝试 将 切换 的 次 数 降 到 最 低 。 








13.7.3 图 像 模 糊 的 实现 概述 











首先 ， 假 设 所 用 模糊 算法 具有 可 分 离 性 ， 据 此 将 模糊 操作 分 为 两 个 
1D 模 糊 运 算 一 一 一 个 横 癌 模糊 运算 ， 一 个 纵向 模糊 运算 。 实 现 这 种 算 
法 需要 两 个 可 读 写 的 纹理 缓冲 区 ， 也 就 是 说 ， 需 要 为 两 个 纹理 分 别 创建 
SRV 与 UAV。 从 现在 开始 ， 我 们 称 这 两 个 纹理 为 纹理 A 与 纹理 B。 据 
此 ， 则 模糊 算法 的 处 理 过 程 如 下 : 








1. 给 纹理 A 绑 定 SRV， 作 为 计算 着 色 需 的 输入 《我 们 会 对 此 输入 图 
像 进 行 模 问 模糊 处 理 ) 。 





2. 给 纹理 B 绑 定 UAV， 作 为 计算 着 色 器 的 输出 《该 输出 图 像 存 有 
横 问 模糊 计算 后 的 数据 ) 。 


3. 分 派 线程 组 执行 横向 模糊 操作 。 完 成 后 ， 纹 理 B 会 存储 横向 模糊 
的 结果 Blurs(1)， 这 里 的 1 束 是 接受 模糊 处 理 的 输入 图 像 。 





4. 为 纹理 B 绑 定 SRV， 作 为 计算 着 色 器 的 输入 此 图 像 就 是 即将 进 
行 纵 回 模糊 且 已 执行 过 横向 模糊 的 图 像 〉。 





5. 为 纹理 A 绑 定 UAV， 作 为 计算 着 色 器 的 输出 “该 输出 纹理 会 存 
有 最 终 的 模糊 图 像 数 据 〉。 


6. 分 发 线程 组 来 执行 纵 问 模糊 操作 。 待 处 理 完毕 后 ， 纹 理 A 会 保 
存 最 后 的 模糊 结果 Binurl)， 其 中 ，7 即 是 最 原始 的 输入 图 像 。 





这 一 系列 逻辑 实现 了 具有 可 分 离 性 质 模糊 公式 
Blur( 了 7) = Blurv(Blurp( 了 用) 的 图 像 处 理工 作 。 可 以 看 出 ， 纹 理 A 与 纹理 B 在 
某 些 时 刻 分 别 充当 了 计算 着 色 器 的 输入 与 输出 ， 但 是 无 法 同时 担任 两 种 








角色 在 将 一 个 资源 同时 绑 定 为 着 色 器 的 输入 与 输出 之 时 ，Direct3D 便 
会 报错 ) 。 将 横向 模糊 过 程 (blur pass) 与 纵向 模糊 过 程 结合 起 来 就 能 
组 成 一 个 完整 的 模糊 过 程 。 对 处 理 后 的 图 像 再 次 进行 模糊 处 理 ， 便 可 以 
使 它 变 得 愈加 模糊 。 我 们 可 以 对 图 像 反 复 进行 模糊 处 理 ， 直 至 达到 满意 


由 于 演 染 到 纹理 中 的 场景 与 窗口 工作 区 要 保持 着 相同 的 分 辩 率 ， 因 
此 我 们 需要 不 时 重新 构建 离 屏 纹理 ， 而 模糊 算法 所 用 的 第 二 个 纹理 B 的 
缓冲 区 也 是 如 此 。 这 可 以 通过 OnResize 方 法 来 实现 : 





void BlurApp: :OnResize() 


D3DApp: :OnResize(); 





// 窗口 大 小 有 了 变化 ， 所 以 要 更 新 纵横 比 ， 并 重新 计算 投影 矩阵 

XMMATRIX P = XMMatrixPerspectiveFovLH( 
86.25f#kMathHelper::Pi，AspectRatio()， 
1.6f，1666.6f); 

XMStoreFloat4x4(&mProj, P); 








if(mBlurFilter != nullptr) 
{ 
mBlurFilter->OnResize(mClientWidth, mClientHeight); 
} 
} 


void BlurFilter::OnResize(UINT newWidth, UINT newHeight) 


if((mWidth != newWidth) || (mHeight != newHeight)) 
{ 

mWidth = newWidth; 

mHeight = newHeight; 























// 以 新 的 大 小 来 重新 构建 离 屏 纹理 资源 


BuildResources(); 











// 既然 创建 了 新 的 资源 ， 我 们 也 应 当 为 其 创建 新 的 描述 
BuildDescriptors() 








DJ 


变量 mBlurFilter 是 我 们 所 编写 的 BlurFilter 辅 助 类 实例 。 此 类 
不 仅 封 装 了 纹理 A 与 纹理 B 的 SRV、UAV 和 纹理 资源 ， 还 提供 了 开启 计 
算 着 色 器 中 实际 模糊 运算 的 方法 。 我 们 即将 讨论 此 辅助 类 的 具体 实现 。 





上 面 曾 提 到 BlurFilter 类 封装 了 纹理 资源 。 为 了 能 够 使 用 绘制 /分 
派 命 令 ， 就 应 当 将 这 0 因此 ， 便 需要 为 这 些 资 源 
创建 相应 的 描述 符 。 同 时 ， 这 也 就 意味 着 我 们 一 定 要 
nn 
辟 额 外 的 空间 来 存储 这 些 描述 符 。BlurFilter: :BuildDescriptors 
方法 就 是 利用 在 推 中 处 于 起 始 位 置 的 描述 符 句 柄 来 存储 BlurFilter 类 
要 用 到 的 描述 符 。 该 方法 缓存 了 模糊 过 程 中 所 需 的 一 切 描 述 符 句 柄 ， 并 
以 此 来 创建 相应 的 描述 符 。 利 用 该 函 0 ee 
大 小 发 生 改 变 时 ， 它 可 以 随 资源 的 变化 而 重新 创建 这 些 描述 











void BlurFilter::BuildDescriptors( 
CD3DX12 CPU_DESCRIPTOR HANDLE hCpuDescriptor， 
CD3DX12_ GPU_DESCRIPTOR HANDLE hGpuDescriptor， 
UINT descriptorSize) 





// 保存 对 描述 符 的 引用 
mBlureCpuSrv = hCpuDescriptor; 

mBlureCpuUav = hCpuDescriptor.0Offset(1, descriptorSize); 
mBluriCpuSrv = hCpuDescriptor.O0ffset(1, descriptorSize); 

















mBluriCpuUav = hCpuDescriptor .Offset(1，descriptorSsize) 
mBlure@GpuSrv = hGpuDescriptor; 

mBlureGpuUav = hGpuDescriptor .Offset(1，descriptorSsize) 
mBluriGpuSrv = hGpuDescriptor.Offset(1, descriptorSize); 
mBluriGpuUav = hGpuDescriptor.Offset(1, descriptorSize); 
BuildDescriptors(); 


void BlurFilter::BuildDescriptors() 


{ 


D3D12_SHADER_RESOURCE_VIEW_DESC srvDesc = {}; 
srvDesc.Shader4ComponentMapping = D3D12 DEFAULT_ SHADER 4 COMPONENT_ MAPPI 


NG ; 


} 


srvDesc.Format = mFormat; 

srvDesc.ViewDimension = D3D12 SRV_DIMENSION TEXTURE2D; 
srvDesc.Texture2D.MostDetailedMip = 6; 
srvDesc.Texture2D.MipLevels = 1; 


D3D12_UNORDERED ACCESS VIEW DESC uavDesc = {}; 


uavDesc.Format = mFormat; 
uavDesc.ViewDimension = D3D12 UAV_DIMENSION TEXTURE2D; 
uavDesc.Texture2D.MipSlice = 90; 


md3dDevice->CreateShaderResourceView(mB1LurMap6.Get()，&srvDesc， 
mBlureCpuSrv); 
md3dDevice->CreateUnorderedAccessView(mB1LurMap6.Get()， 
nullptr, &uavDesc, mBlureCpuUav); 


md3dDevice->CreateShaderResourceView(mBlurMap1.Get(), &srvDesc, 
mBlur1iCpuSrv); 
md3dDevice->CreateUnorderedAccessView(mBlurMap1 .Get(), 
nullptr, &uavDesc, mBluriCpuUav); 





// 以 下 代码 位 于 BlurApp.cpp 文 件 中 ... 


// 创建 BlurFilter 类 所 用 资源 的 描述 符 来 填充 描述 符 堆 








mBlurFilter->BuildDescriptors( 


CD3DX12 CPU_DESCRIPTOR HANDLE( 
mCbvSrvUavDescriptorHeap->GetCPUDescriptorHandleForHeapStart(),， 
3, mCbvSrvUavDescriptorSize), 

CD3DX12_GPU_DESCRIPTOR HANDLE( 
mCbvSrvUavDescriptorHeap->GetGPUDescriptorHandleForHeapStart(),， 
3, mCbvSrvUavDescriptorSize), 

mCbvSrvUavDescriptorSize); 





对 图 像 进行 模糊 处 理 是 一 种 昂贵 的 操作 ， 它 所 花费 的 时 间 与 待 处 理 





的 图 像 大 小 奶 明 相 天。 一 般 情况 下 ， 在 把 场景 演 染 到 离 屏 纹理 的 时 候 ， 
我 们 通 肖 会 将 离 屏 纹理 的 大 小 设 为 后 台 绥 冲 区 尺寸 的 14。 也 就 是 说 ， 
假使 后 台 缓 冲 区 的 大 小 为 800 x 600， 则 离 屏 纹理 的 尺寸 将 为 400 x 300。 
这 样 一 来 不 仅 能 加 快 离 屏 纹理 的 绘制 速度 〈 即 减少 了 需要 填充 的 像 系数 
量 ) ， 而 且 能 同时 提升 模糊 图 像 的 处 理 速度 〈 需 要 模糊 的 像素 也 变 得 更 
少 ) 。 允 外 ， 当 纹理 从 1/4 的 屏 峰 分 辨 率 拉 伸 为 完整 的 屏 医 分 辨 挛 时 ， 
纹理 放大 (magnification〉 过 小 右 也 会 执行 一 些 额 外 的 模糊 操作 。 


假设 要 处 理 的 图 像 宽 为 wu、 高 为 .。 正 如 我 们 将 在 下 一 小 节 中 所 看 到 
的 计算 着 色 器 代码 所 写 ， 对 于 1D 横 向 模糊 而 言 ， 一 个 线程 组 用 256 个 线 
程 来 处 理 水 平方 向 上 的 线段 ， 而 且 每 个 线程 又 负责 图 像 中 一 个 像素 的 模 
糊 操作 。 因 此 ， 为 了 图 像 中 的 每 个 像素 都 能 得 到 模糊 处 理 ， 我 们 需要 在 
z 方 向 上 分 派 < (555) 个 线程 组 (cei/ 为 向 上 取 整 函数 ) ， 且 在 y 方 向 上 
调度 h 个 线程 组 。 如 果 ww 不 能 被 256 整 除 ， 则 最 后 一 次 分 派 的 线程 组 会 存 
有 多 余 的 线程 〈 见 图 13.8) 。 我 们 对 于 这 种 情况 无 能 为 力 ， 因 为 线程 组 
的 大 小 固定 。 因 此 ， 我 们 只 得 把 注意 力 放 在 着 色 器 代码 中 越界 问题 的 钳 
位 检测 (clamping check) 之 上 。 


1D 纵 问 模糊 与 上 述 1D 横 问 模 糊 的 情况 相似 。 在 纵 问 模糊 过 程 中 ， 
线程 组 就 像 由 256 个 线程 构成 的 垂直 线段 ， 每 个 线程 只 负责 图 像 中 一 个 


像 系 的 模糊 运算 。 因 此 ， 为 了 使 图 像 中 的 每 个 像 了 系 都 能 得 到 模糊 处 理 ， 
h 


、 、 ceil ( 帝 ) 、 、 、 、 
我 们 需要 在 y 方 向 上 分 派 226/ 个 线程 组 ， 并 在 zx 方 向 上 调度 w 个 线程 





多 出 来 的 线程 
8x1 线 程 组 
-中 人 


高 =14 

































































1x8 线程 组 








高 =14 

















多 出 来 
的 线程 





图 13.8 ”现在 来 考虑 对 一 个 28 X 14 像 素 的 纹理 进行 处 理 ， 我 们 所 用 的 横向 、 纵 向 线程 组 的 规 
模 分 别 为 3 x 1 与 1 x 8 (采用 的 是 入 x 工 的 表示 格式 ) 。 对 于 水 平方 向 的 处 理 过 程 来 说 ， 为 

















) 28 
ceit ($) = coil (BE ) -4 
了 处 理 所 有 的 像素 ， 我 们 需要 在 I 方向 上 分 派 8 8 个 线程 组 ， 并 在 Y 
方向 上 调度 14 个 线程 组 。 由 于 28 并 非 8 的 整数 倍 ， 所 以 最 右 侧 的 线程 组 中 会 有 
(4 x 8 一 28) x 14 = 56 个 线程 什么 都 不 做 。 对 于 垂直 方向 的 处 理 过 程 而 言 ， 为 了 处 理 所 有 








ceil (人 = ceil 3 一 了 
的 像素 ， 我 们 需要 在 7 方向 上 分 派 3 8 个 线程 组 ， 并 在 z 方 向 上 调度 
28 个 线程 组 。 同 理 ， 由 于 14 并 不 是 8 的 整数 倍 ， 所 以 最 下 侧 的 线程 组 中 会 有 (2 X 8 一 14) x 28 
个 闲置 的 线程 。 沿 用 这 同一 思路 即 可 将 线程 组 拓展 为 256 个 线程 的 规模 来 处 理 更 大 的 纹理 





























下 列 代 码 不 仅 计 算出 了 每 个 方向 上 要 分 派 的 线程 组 数量 ， 还 真正 地 





开 司 了 计算 着 色 器 的 模糊 运算 : 





void BlLurFilter: :Execute(ID3D12GraphicsCommandList#k cmdList， 
ID3D12RootSignature* rootSig, 
ID3D12PipelineState* horzBlLurPSsO， 
ID3D12PipelineState* VertBlLurPSsO， 
ID3D12Resource* input, 

int blurCount) 


auto weights = CalcGaussWeights(2.5f); 
int blurRadius = (int)weights.size() / 2; 


cmdList->SetComputeRootSignature(rootSig); 


cmdList->SetComputeRoot32BitConstants(60, 1, &blurRadius, 0); 
cmdList->SetComputeRoot32BitConstants(6, (UINT)weights.size(), 
weights.data(), 1); 


cmdList->ResourceBarrier(1, &CD3DX12 RESOURCE BARRIER::Transition(input, 
D3D12_RESOURCE_ STATE_ RENDER TARGET, D3D12 RESOURCE STATE COPY_ SOURCE)) 


cmdList->ResourceBarrier(1, &CD3DX12 RESOURCE BARRIER::Transition( 
mBlurMape .Get()， 
D3D12_RESOURCE STATE COMMON, D3D12 RESOURCE STATE COPY_DEST)); 





UD 








// 将 输入 的 资源 数据 《此 例 中 是 后 台 绥 冲 区 ) 复制 到 BlurMap@ 
cmdList->CopyResource(mB1LurMap6.Get()，input); 











cmdList->ResourceBarrier(1, &CD3DX12 RESOURCE BARRIER::Transition( 
mBlurMapQ .Get(), 
D3D12_ RESOURCE STATE COPY_ DEST, D3D12 RESOURCE STATE GENERIC READ)); 


cmdList->ResourceBarrier(1, &CD3DX12 RESOURCE BARRIER::Transition( 
mBlurMap1 .Get(), 
D3D12 RESOURCE STATE COMMON, D3D12 RESOURCE STATE UNORDERED ACCESS)); 


for(int i = 6; i < blurCount; ++i) 


{ 


// 
// 水 平方 向 上 的 模糊 处 理 过 程 
// 




















cmdList->SetpipelineState(horzBlurPSO); 


cmdList->SetComputeRootDescriptorTable(1, mBlur@GpuSryv); 


cmdList->SetComputeRootDescriptorTable(2, mBlurlGpuUav); 


























// 大 每 个 线程 组 能 处 理 256 个 像素 “256 这 个 值 是 在 计算 着 色 器 中 定义 的 ) ， 那 么 处 理 一 
行 像素 需要 分 派 




















// 几 个 线程 组 呢 
UINT numGroupsX = (UINT)ceilf(mWidth / 256.6f); 
cmdList->Dispatch(numGroupsX, mHeight, 1); 


cmdList->ResourceBarrier(1, &CD3DX12 RESOURCE BARRIER 
mBlurMapQ .Get(), 
D3D12 RESOURCE STATE_ GENERIC_ READ, 
D3D12_ RESOURCE_ STATE_ UNORDERED ACCESS)); 


cmdList->ResourceBarrier(1, &CD3DX12 RESOURCE BARRIER 
mBlurMap1 .Get(), 
D3D12 RESOURCE_ STATE _ UNORDERED ACCESS, 
D3D12 RESOURCE_ STATE_GENERIC READ)); 























// 垂直 方向 上 的 模糊 处 理 过 程 




















cmdList->SetPpipelineState(vertBlurPSO); 


::Transition( 


::Transition( 


cmdList->SetComputeRootDescriptorTable(1, mBlur1lGpuSryv); 
cmdList->SetComputeRootDescriptorTable(2, mBlur@GpuUav); 


























// 每 个 线程 组 能 人 处理 256 个 像素 (256 这 个 值 是 在 计算 着 色 器 中 定义 的 ) ， 那 么 需要 分 ? 











几 个 线程 组 才能 


} 





























// 处 理 一 列 像素 呢 
UINT numGroupsY = (UINT)ceilf(mHeight / 256.6f) 
cmdList->Dispatch(mWidth, numGroupsY, 1); 





cmdList->ResourceBarrier(1, &CD3DX12 RESOURCE BARRIER 
mBlurMape .Get(), 
D3D12 RESOURCE_ STATE UNORDERED ACCESS, 
D3D12_ RESOURCE STATE_GENERIC READ)); 


cmdList->ResourceBarrier(1, &CD3DX12 RESOURCE BARRIER 
mBlurMap1 .Get(), 
D3D12 RESOURCE STATE_ GENERIC_ READ, 
D3D12 RESOURCE_ STATE_ UNORDERED ACCESS)); 


} 


图 13.9 所 示 为 “Blur”( 模 糊 ) 演示 程序 的 效果 。 





::Transition( 


::Transition( 


























图 13.9 ” 左 图 “Blur”( 模 糊 ) 演示 程序 的 效果 ， 此 图 像 为 经 两 次 模糊 处 理 后 的 效果 
右 图 ， 同 是 “Blur” 演 示 程 序 的 效果 ， 但 达到 此 效果 要 经 8 次 模糊 处 理 





13.7.4 计算 着 色 需 程序 


在 这 一 节 中 ， 我 们 将 查阅 实际 执行 模糊 运算 的 计算 着 色 器 程序 。 不 
过 ， 我 们 仅 讨 论 水 平 模糊 这 一 种 情况 ， 因 为 垂直 模糊 的 细节 与 之 相仿 ， 
只 是 方向 上 不 同 而 已 。 


就 像 上 一 人 小节 中 所 提 到 的 ， 我 们 分 派 的 线程 组 是 由 256 个 线程 构成 
的 水 平 “ 线 段 >， 每 个 线程 都 负责 图 像 中 一 个 像素 的 模糊 操作 。 表 先 要 讲 
解 的 是 按部就班 实现 模糊 算法 的 低 效 方案 ， 即 每 个 线程 都 简单 地 计算 出 
以 正在 处 理 的 像素 为 中 心 的 行 矩 了 泗 〈 因 为 我 们 正在 进行 的 是 1D 横 癌 模 
糊 处 理 ， 所 以 要 针对 行 窍 阵 进 行 计 算 ) 的 加 权 平 均值 。 这 个 方法 的 缺点 
是 需要 多 次 拾取 同一 纹 素 〈 见 图 13.10) 。 





我 们 可 以 根据 13.6 市 中 所 述 的 模糊 处 理 集 略 ， 利 用 共 至 内 存 来 优化 
上 述 算法 。 这 样 一 来 ， 每 个 线程 就 可 以 在 共 至 内 存 中 读 取 或 存储 其 所 二 
的 纹 素 数据 。 每 所 有 线程 都 从 共 圣 内 存 读 取 它 们 所 需 的 纹 素 之 后 ， 束 能 





够 执行 模糊 运算 了 。 不 得 不 说 ， 从 共享 内 存 中 读 取 数据 的 速度 飞快 。 除 
此 之 外 ， 还 有 一 件 环 手 的 事 ， 即 利用 具有 mn= 256 个 线程 的 线程 组 行 模糊 
运算 的 时 候 ， 却 需要 共 n + 2 有 个 纹 素 数据 ， 这 里 的 已 加 是 模糊 半径 〈 见 
图 13.11) 。 
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图 13.10 仅 考 虑 输入 图 像 中 的 这 两 个 相 邻 像素 ， 假 设 模糊 核 为 ! x 7。 不 难看 出 ， 在 对 这 两 个 
像素 进行 模糊 的 过 程 中 ，8 个 像素 中 有 6 个 被 采集 了 2 次 ， 即 每 个 模糊 像素 过 程 各 对 这 6 个 像素 采 
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图 13.11 ”由 于 模糊 半径 的 原因 ， 在 处 理 线程 组 边界 附近 的 像素 时 ， 可 能 会 读 取 线程 组 以 外 存 
在 “越界 ”情况 的 像素 





解决 办 法 其 实 也 并 不 复杂 。 我 们 只 需 分 配 出 能 容 下 n + 28 个 元 素 的 
共享 内 存 ， 并 且 有 2R 个 线程 要 各 获取 两 个 纹 素 数据 。 唯 一 抹 烦 的 地 方 就 
是 在 索引 共享 内 存 时 要 多 花 些 心思 ， 因 为 组 内 线程 ID 此 时 不 能 与 共享 内 
存 中 的 元 素 一 一 对 应 了 。 图 13.12 演 示 了 当 忆 = 4 时 ， 从 线程 到 共享 内 存 
的 映射 过 程 。 





共有 N+2R 个 纹 素 数据 的 共享 内 存 
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图 13.12 ”在 此 例 中 ， 民 = 4。 最 左 侧 的 4 个 线程 以 及 最 右 侧 的 4 个 线程 ， 每 个 都 要 读 取 2 个 纹 素 
数据 ， 并 将 它们 存 于 共享 内 存 之 中 。 而 这 8 个 线程 之 外 的 所 有 线程 只 需 读 取 1 个 纹 素 ， 并 将 其 存 
于 共享 内 存 
之 中 。 这 样 一 来 ， 我 们 即 可 得 到 以 模糊 半径 下 对 上 个 像素 进行 模糊 处 理 所 需 的 所 有 纹 素数 据 














现在 要 讨论 的 是 最 后 一 种 情况 ， 即 图 13.13 中 所 示 的 最 左 侧 与 最 右 
侧 的 线程 组 在 索引 输入 图 像 时 会 发 生 越 界 的 情形 。 


由 于 模糊 六 径 的 原因 ， 最 左 侧 线程 块 余下 的 若干 线程 也 将 执行 


中 最 左 侧 的 几 个 线程 将 采集 图 像 之 外 模糊 运算 ， 并 将 数据 写 入 
的 数据 共享 内 存 










































































图 13.13 我们 可 能 对 图 像 边界 以 外 的 数据 进行 读 取 的 情况 


从 越界 的 索引 处 读 取 数据 并 不 是 非法 操作 一 一 与 之 对 应 的 行为 定义 
是 返回 0 (对 越界 索引 处 进行 写 入 是 不 会 执行 任何 操作 的 ， 即 no-op)。 
然而 ， 我 们 在 读 取 越 界 数 据 时 却 不 希望 得 到 数据 0， 因 为 这 意味 着 值 为 0 
的 颜色 《〈 即 黑色 ) 会 影响 到 边界 处 的 模糊 结果 。 我 们 此 时 期 盼 能 实现 出 





类 似 于 钳 位 〈clamp) 纹理 寻 址 模式 的 效果 ， 即 在 读 取 越 界 的 数据 时 ， 
能 够 获得 一 个 与 边界 纹 素 相 同 的 数据 。 这 个 方案 可 通过 对 索引 进行 钳 位 
来 加 以 实现 : 








// 针对 图 像 左 侧 边 界 处 的 越界 采样 情况 进行 钳 位 操作 
int x = max(dispatchThreadID.x - gBlurRadius, 0); 
gCache[groupThreadID.x] = gInput[int2(x, dispatchThreadID.y)]; 





// 对 于 图 像 右 侧 边界 处 所 存在 的 越界 采样 情况 进行 的 钳 位 操作 
int x = min(dispatchThreadID.x + gBlurRadius, gInput.Length.x-1); 
gCache[groupThreadID.x+2*gBlurRadius] = gInput[int2(x, dispatchThreadID.y) 


]; 


// 对 图 像 边界 处 存在 的 越界 采样 情况 进行 钳 位 操作 
gCache[groupThreadID.x+gBlurRadius] = 
gInput[min(dispatchThreadID.xy, gInput.Length.xy-1)]; 


























完整 的 着 色 咒 代码 如 下 。 




















cbuffer cbSettings : register(b6) 





























{ 
// 我 们 不 能 把 根 常量 映射 到 位 于 常量 缓冲 区 中 的 数组 元 素 ， 因 此 要 将 每 一 个 元 素 都 一 一 列 





| 


int gBlurRadius; 


// 最 多 支持 11 个 模糊 权 值 
float we; 
float wi1; 
float w2; 
float w3; 
float w4; 
float w5 ; 
float w6 ; 
float w7; 
float w8 ; 
float w9; 
float WwW190 





}; 
static const int gMaxBlurRadius = 5; 


Texture2D gInput : register(t0Q); 
RWTexture2D<float4> gOutput : register(u0); 


#define N 256 
#define CacheSize (N + 2*gMaxBlurRadius) 
groupshared float4 gCache[CacheSize]; 


[numthreads(N, 1, 1)] 
void HorzBlurCS(int3 groupThreadID : SV_GroupThreadID, 
int3 dispatchThreadID : SV_DispatchThreadID) 
{ 
// 放 在 数组 中 便于 索引 
float weights[11] = { we, wl, w2, w3, w4, w5, w6, w7, w8, w9, w10 }; 





// 

// 通过 填写 本 地 线程 存储 区 来 减少 带宽 的 负载 。 吞 要 对 N 个 像素 进行 模糊 处 理 ， 根 据 模糊 
半径 ， 我 们 需要 

// 加 载 N + 2*BlurRadius 个 像素 

// 





















































// 此 线程 组 运行 着 N 个 线程 。 为 了 获取 额外 的 2*BlurRadius 个 像素 ， 就 需要 有 2*BlurRad 
ius 个 线程 


// 都 多 采集 一 个 像素 数据 
if(groupThreadID.x < gBlurRadius) 

















// 对 于 图 像 左 侧 边 界 存 在 越界 采样 的 情况 进行 钳 位 操作 
int x = max(dispatchThreadID.x - gBlurRadius, 0); 
gCache[groupThreadID.x] = gInput[int2(x, dispatchThreadID.y)]; 


if(groupThreadID.x >= N-gBlurRadius) 








{ 
// 对 于 图 像 右 侧 边界 处 的 越界 采样 情况 进行 钳 位 操作 
int x = min(dispatchThreadID.x + gBlurRadius, gInput.Length.x-1); 
gCache[groupThreadID.x+2*gBlurRadius] = gInput[int2(x, dispatchThreadI 
D.y)]; 
} 


// 针对 图 像 边界 处 的 越界 采样 情况 进行 钳 位 处 理 
gCache[groupThreadID.x+gBlurRadius] = gInput[min(dispatchThreadID.xy, 
gInput.Length.xy-1)]; 























HE 








// 等 待 所 有 的 线程 完成 任务 
GroupMemoryBarrierWithGroupSync(); 








// 
// 现在 对 每 个 像素 进行 模糊 处 理 
// 











float4 blurColor = float4(6, 606, 6, 0); 


for(int i = -gBlurRadius; i <= gBlurRadius; ++i) 
{ 
int k = groupThreadID.x + gBlurRadius + i; 


blurColor += weights[i+gBlurRadius]*gCache[k]; 
} 


gOutput[dispatchThreadID.xy] = blurColor; 
} 


[numthreads(1, N, 1)] 
void VertBlurCS(int3 groupThreadID : SV_GroupThreadID, 
int3 dispatchThreadID : SV_DispatchThreadID) 
{ 
// 放 入 数组 中 便于 索引 
float weights[11] = { we, wl, w2, w3, w4, w5, w6, w7, w8, w9, w10 }; 


// 

// 填写 本 地 线程 存储 器 来 减少 带宽 的 负荷 。 如 果 要 对 N 个 像素 进行 模糊 处 理 
半径 ， 我 们 就 需 

// 要 加 载 共 N + 2*BlurRadius 个 像素 

// 















































再 加 上 模糊 
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// 该 线程 组 运行 着 N 个 线程 。 要 取得 另外 2*BlurRadius 个 像素 的 话 ， 就 需要 有 2*BlurRad 
ius 个 线程 


// 要 额外 多 采集 一 个 像素 
if(groupThreadID.y < gBlurRadius) 












































{ 
// 对 于 图 像 上 侧 边界 处 的 越界 采样 情况 进行 钳 位 处 理 
int y = max(dispatchThreadID.y - gBlurRadius, 0); 
gCache[groupThreadID.y] = gInput[int2(dispatchThreadID.x, y)]; 


} 
if(groupThreadID.y >= N-gBlurRadius) 








T 




















{ 
// 针对 图 像 下 侧 边 界 处 的 越界 采样 情况 进行 钳 位 处 理 
int y = min(dispatchThreadID.y + gBlurRadius, gInput.Length.y-1); 
gCache[groupThreadID.y+2*gBlurRadius] = gInput[int2(dispatchThreadID.x 
，y)]; 
} 


// 对 于 图 像 边界 处 的 越界 采样 情况 进行 钳 位 处 到 
gCache[groupThreadID.y+gBlurRadius] = gInput[min(dispatchThreadID.xy, 








T 














HE 











gInput.Length.xy-1)]; 


// 等 待 所 有 的 线程 都 完成 各 自 的 任务 
GroupMemoryBarrierWithGroupSync(); 














// 
// 现在 对 每 一 个 像素 都 进行 模糊 处 理 
// 



































float4 blurColor = float4(6, 6, 6, 0); 


for(int i = -gBlurRadius; i <= gBlurRadius; ++i) 


{ 
int k = groupThreadID.y + gBlurRadius + i; 


blurColor += weights[i+gBlurRadius]*gCache[k]; 
} 


gOutput[dispatchThreadID.xy] = blurColor; 





至 于 最 后 一 行 代码 


最 右 侧 的 线程 组 可 能 存 有 一 些 多 余 的 线程 ， 但 输出 的 纹理 中 并 没有 
与 之 对 应 的 元 素 〈 音 即 它 们 根本 无 需 输出 任何 数据 ， 见 图 13.13) 。 此 
时 ，dispatchThreadID.xy 即 为 输出 纹理 之 外 的 一 个 越界 索引 。 但 是 
我 们 无 须 为 此 而 担心 ， 因 为 向 越 界 处 写 入 数据 的 效果 是 不 进行 任何 操作 
(no-op) 。 














13.8 ”拓展 资料 


计算 着 色 器 编程 自 成 一 体 ， 有 几 本 书 专门 讲解 GPU 在 通用 计算 程序 
方面 上 的 应 用 。 


1. 《Programming Massively Parallel Processors: A Hands-on 
Approach》“《 大 规模 并 行 处 理 占 编程 实战 》《 大 规模 并 行 处 理 絮 程序 
设计 》) ， 作 者 为 David B. Kirk 和 Wen-mei W. Hwu。 


2. 《OpenCL Programming Guide》 〈《OpenCL 编 程 指南 》) ， 作 
者 为 Aaftab Munshi, Benedict R. Gaster, Timothy G. Mattson, James Fung 和 
Dan Ginsburg 。 


CUDA 与 OpenCL 其 实 就 是 以 访问 GPU 来 编写 通用 计算 程序 的 两 组 
不 同 的 API。 对 CUDA 与 OpenCL 程 序 的 最 佳 实践 也 就 是 对 
DirectComputel" 编 程 的 最 佳 实践 ， 因 为 这 几 类 功能 类 似 的 程序 都 运行 在 
相同 的 人 硬件 之 上 。 在 本 间 中 ， 我 们 已 经 接触 了 DirectCompute 编 程 中 的 大 
部 分 语法 ， 由 此 ， 我 们 可 以 轻而易举 地 将 CUDA 与 OpenCL 程 序 问 
DirectCompute 移 植 。 





Chuck Walbourn 发 布 的 一 篇 博客 上 含有 一 些 介 绍 DirectCompute 技 术 
的 链接 : 





http://blogs.msdn.com/b/chuckw/archive/2010/07/14/directcompute.aspx 


另外 ， 微 软 公 司 的 Channel 9 有 一 系列 关于 DirectCompute 的 讲解 视 
频 《DirectCompute Lecture Series》 : 


http://channel9.msdn.com/tags/DirectCompute-Lecture-Series/ 


最 后 要 提 到 的 是 ，NVIDIA 公 司 还 针对 CUDA 技 术 专 门 设置 了 一 整 
套 培训 课程 《Existing University Courses》 。 


尤其 是 那些 出 自 伊利 诺 伊 大 学 的 完整 CUDA 编 程 视频 讲座 ， 我 们 在 
此 极力 推荐 。 再 次 重申 ， 我 们 可 以 把 CUDA 理 解 为 用 于 访问 GPU 计算 功 
能 的 另 一 种 API。 只 要 理解 了 这 些 语法 ， 我 们 就 掌握 了 编写 高 效 GPU 通 
用 计算 程序 的 关键 部 分 。 通 过 学 习 这 些 CUDA 讲 座 ， 我 们 将 对 GPU 硬件 
的 工作 机 制 有 更 加 深入 的 理解 ， 继 而 写 出 优化 程度 更 高 的 代码 。 


13.9 小结 


1. 调用 ID3D12GraphicsCommandList::Dispatch 这 个 API 即 可 
分 派 一 个 线程 组 网 格 。 每 个 线程 组 都 是 一 个 由 线程 构成 的 3D 网 格 ， 线 
星 组 中 的 线程 数 由 计算 着 色 器 里 的 [numthreads(x,y,z)] 属 性 来 指 
定 。 出 于 对 性 能 的 考量 ， 线 程 的 总 数 应 为 warp 大 小 〈 这 是 NVIDIA 公 司 
所 生产 硬件 的 基本 调度 单位 ， 它 的 大 小 是 32) 的 整数 倍 或 wavefront 尺 寸 
(这 是 AMD (ATI) 公司 所 生产 硬件 的 基本 调度 单位 ， 其 大 小 为 64) 的 


整数 倍 。 


2. 为 了 保证 处 理 的 并 行 性 (parallelism) ， 应 至 少 为 每 个 多 处 理 器 
分 派 两 个 线程 组 。 所 以 ， 奋 硬件 具有 16 个 多 处 理 器 ， 则 应 当 至 少 调度 32 
个 线程 组 ， 以 确保 所 有 的 多 处 理 器 每 时 每 刻 都 在 工作 。 未 来 的 硬件 很 可 
能 会 载 有 更 多 的 多 处 理 嚣 ， 所 以 我 们 编写 的 程序 也 应 适当 地 调 高 线程 组 
数量 ， 以 便 针 对 未 来 的 硬件 设备 进行 扩展 。 





3. 一 旦 把 线程 组 分 配给 多 处 理 器 ，NVIDIA 硬 件 就 会 将 组 中 的 线程 
按 32 个 一 组 划分 为 warp。 而 后 ， 多 处 理 需 会 以 SIMD 的 方式 〈 即 同一 
warp 中 的 每 个 线程 都 执行 相同 的 指令 ) 调度 以 多 个 线程 所 构成 的 warp 进 
行 处 理工 作 。 如 果 一 个 warp 因 处 理 抓 取 纹 理 内 存 这 样 的 工作 而 暂时 停止 
运行 ， 则 多 处 理 器 会 迅速 切换 到 另 一 个 warp 并 执行 此 warp 中 的 相应 指 
令 ， 以 此 来 屏蔽 这 种 暂停 的 情况 。 这 会 使 多 处 理 器 连续 不 停 地 运转 ， 以 
保持 忙碌 的 状态 ， 从 而 充分 发 挥 其 计算 能 力 。 现 在 就 能 解释 为 什么 我 们 
建议 将 线程 组 的 大 小 设置 为 warp 尺 寸 的 整数 倍 了 。 寿 非 如 此 ， 则 在 线程 


组 向 warp 划 分 的 过 程 中 ， 会 有 warp 被 掺 入 什么 都 不 做 的 无 用 线程 。 


4. 若 要 通过 计算 着 色 器 访问 纹理 资源 ， 可 为 输入 的 纹理 创建 
SRV， 再 将 其 与 计算 着 色 器 相 绑 定 。RNWTexture2D 是 一 种 可 供 计算 着 色 
器 读 写 的 纹理 ， 我 们 可 以 通过 为 纹理 创建 UAV (无 序 访问 视图 ) 并 把 它 
与 计算 着 色 器 相 绑 定 来 创建 这 种 纹理 。 纹 理 元 素 可 用 [] 运 算 符 表示 法 进 
行 索 引 ， 或 者 通过 纹理 坐标 、SamplerState (采样 器 状态 ) 配 
合 SampleLevel 方 法 来 开展 采样 。 


5. 结构 化 缓冲 区 是 一 种 由 相同 类 型 元 素 构成 的 缓冲 区 ， 这 与 数组 
有 些 相 似 。 其 元 素 类 型 可 以 是 用 户 自 定义 的 结构 体 。 只 读 结构 化 缓冲 区 
的 HLSL 定 义 是 这 样 的 : 


而 用 HLSL 定 义 可 读 写 结构 化 缓冲 区 的 方法 为 : 


要 让 计算 着 色 器 访问 只 读 缓 冲 区 资源 ， 只 需 为 它 创 建 对 应 的 SRV， 
再 将 其 绑 定 到 计算 着 色 器 上 即 可 ; 和 若 要 计算 着 色 器 访问 可 读 写 缓冲 区 资 
源 ， 仅 需 为 其 创建 可 供 读 写 的 UAV， 而 后 再 将 它 与 计算 着 色 器 相 绑 定 。 


6. 各 种 类 型 的 线程 ID 可 通过 系统 值 传 入 计算 着 色 嚣 中。 这些 ID 则 
通常 会 用 作 资 源 与 共 诗 内 存 的 索引 。 








7. 消费 结构 化 缓冲 区 与 追加 结构 化 缓冲 区 在 HLSL 中 的 定义 如 下 : 


AppendstructuredBuffer<DataType> gOutput 

如 果 数 据 元 素 的 处 理 顺 序 与 最 终 写 入 输出 缓冲 区 中 的 顺序 是 无 关 紧 
要 的 ， 那 么 这 两 种 结构 缓冲 区 将 是 不 错 的 选择 ， 因 为 它们 能 使 我 们 经 开 
索 项 的 索引 语法 。 要 注意 的 是 ， 退 加 缓冲 区 的 空间 并 不 能 目 动 按 需 增 
长 ， 但 是 它们 一 定 有 足够 空间 来 容 下 我 们 同 其 退 加 的 所 有 数据 元 象 。 














8. 所 有 的 线程 组 都 有 一 块 被 称 为 共享 内 存 或 线程 本 地 存储 器 的 空 
间 。 该 共享 内 存 的 访问 速度 极 快 ， 可 以 与 硬件 缓存 比肩 。 而 且 ， 此 共有 至 
内 存 对 于 性 能 优化 或 实现 特定 算法 极为 有 益 。 在 计算 着 色 器 的 代码 中 ， 
共 孚 内 存 的 声明 如 下 : 


groupshared float4 gCache[N]; 


N 是 用 户 所 需 的 数组 大 小 ， 但 是 要 注意 ， 线 程 组 共享 内 存 的 上 限 是 
32kb。 假 设 一 个 多 处 理 器 最 多 支持 32 kb 的 共享 内 存 ， 考 虑 到 性 能 ， 一 
个 线程 组 所 用 的 共享 内 存 应 不 多 于 16 kb， 和 否则 一 个 多 处 理 器 将 无 法 交 
蔡 运 行 两 个 这 样 的 线程 组 ， 从 而 难以 保证 其 持续 运转 。 








9. 尽量 避免 在 计算 处 理 与 泻 染 过 程 之 间 进 行 切 换 ， 因 为 这 会 产生 
开销 。 一 般 来 讲 ， 我 们 在 每 一 帧 中 应 先 径 试 完成 所 有 的 计算 任务 ， 而 后 
再 执行 后 续 的 所 有 泻 染 工 作 。 





13.10 ”练习 








1. 编写 一 个 计算 着 色 右 ， 令 其 输入 为 具有 64 个 3D 向 量 ( 同 量 的 模 
为 范围 [1, 10] 内 的 随机 数 ) 的 结构 化 缓冲 区 。 此 计算 着 色 器 的 功能 是 计 
算 癌 量 的 长 度 ， 并 将 结果 输出 到 一 个 浮 点 缓冲 区 之 中 。 最 后 ， 把 运算 结 
果 复 制 到 CPU 器 的 内 存 之 中 ， 再 转 存 至 文件 内 。 程 序 执行 后 ， 要 验证 所 
有 回 量 的 长 度 是 否 在 范围 [1 10] 之 间 。 








2. 用 特定 类 型 的 缓冲 区 再 次 实现 练习 1。 即 以 Buffer<float3> 定 
义 输入 缓冲 区 ， 再 令 Buffer<float> 作 为 输出 缓冲 区 。 


3. 假设 以 上 习题 中 的 回 量 都 进行 规范 化 处 理 ， 而 且 它 们 在 缓冲 区 
中 的 排列 顺序 是 无 关 紧 要 的 ， 试 利用 追加 绥 冲 区 与 消费 缓冲 区 再 次 实现 
练习 1。 





4. 研究 双边 模糊 (bilateral blur， 也 称 作 双边 滤波 器 ，Bilateral 
filter) 技术 ， 并 用 计算 着 色 器 来 加 以 实现 。 最 后 ， 以 此 技术 来 完成 另 一 
版 本 的 “Blur” (模糊 ) 演示 程序 。 


5. 在 此 之 前 ， 我 们 已 在 演示 程序 里 通过 Waves.h/.cpp 文 件 中 的 
Waves 类 ， 利 用 CPU 来 计算 2D 波 浪 的 模拟 运动 方程 。 现 将 此 功能 交 由 
GPU 端 处 理 ， 并 以 类 型 为 float 的 纹理 来 分 别 存储 之 前 帧 、 当 前 帧 以 及 
后 续 帧 的 浪 高 数据 。 由 于 UAV 是 可 读 写 资源 ， 所 以 仅 使 用 此 类 型 的 视图 
即 可 ， 而 无 须 再 涉及 SRV: 





RWTexture2D<float> gPrevSolInput : register(u6) ; 


RWTexture2D<float> gCurrSolInput : register(u1); 
RWTexture2D<float> gOutput : register(u2); 





下 面 就 可 以 利用 计算 着 色 器 来 执行 波浪 的 更 新 运算 了 。 运 用 一 个 独 
立 的 计算 着 色 器 生成 水 波 ， 可 以 使 这 一 工作 过 程 免 受 其 他 任务 的 干扰 。 
在 完成 栅 格 高 度 的 更 新 后 ， 我 们 就 可 以 利用 与 其 项 点 有 着 同样 分 辨 京 的 
波浪 纹理 来 演 染 三 角形 栅 格 (所 以 每 个 栅 格 顶点 都 有 与 之 对 应 的 弘 
素 ) ， 再 将 当前 的 波浪 纹理 绑 定 到 以 下 的 新 “波浪 ”顶点 着 色 器 。 接 下 
来 ， 我 们 就 能 在 顶点 着 色 器 中 对 纹理 进行 采样 并 将 其 移动 到 相应 的 位 置 
高 度 上 《这 称 为 位 移 贴图 ，displacement mapping， 也 有 译作 置换 贴图 、 
位 移 映 射 等 ) ， 再 估算 出 法 线 。 











VertexOut VS(VertexIn vin) 


VertexOut vout = (VertexOut)0.ef; 


#ifdef DISPLACEMENT MAP 
// 使 用 未 经 变换 的 纹理 坐标 在 范围 [6,1]^2 内 采集 位 移 贴图 
vin.PosL.y += gDisplacementMap.SampleLevel(gsamLinearWrap，vin.TexC，1.6 
f).r; 
// 通过 有 限 差分 (finite difference) 来 估算 法 线 
float du = gDisplacementMapTexelSize.x; 
float dv = gDisplacementMapTexelSize.y; 
float 1 = gDisplacementMap.SampleLevel( gsamPointClamp， 
vin.TexC-float2(du, 8.6f), 0.6f ).r; 
float r = gDisplacementMap.SampleLevel( gsamPointClamp， 
vin.TexC+float2(du, 8.6f), 0.6f ).r; 
float t = gDisplacementMap.SampleLevel( gsamPointClamp， 
vin.TexC-float2(6.6f, dv), 8.6f ).r; 
float b = gDisplacementMap.SampleLevel( gsamPointClamp， 
vin.TexC+float2(6.6f, dv), 80.6f ).r; 
































vin.NormalL = normalize( float3(-r+l, 2.6f*gGridSpatialSstep, b-t) ); 


#endif 








// 把 顶点 变换 到 世界 空间 
float4 posW = mul(float4(vin.PosL, 1.6f), gWorld); 
vout .PosN = posW.xyz; 











// 假设 这 里 要 执行 的 是 等 比 缩放 ， 和 否则 需 使 用 世界 和 矩阵 的 逆转 置 窍 
vout .NormalN = mul(vin.NormalL, (float3x3)gWorld); 


导 











// 将 顶点 转换 到 齐 次 裁剪 空间 
vout .PosH = mul(posW, gViewpPro]j); 


// 为 三 角形 插值 而 输出 顶点 属性 
float4 texC = mul(float4(vin.TexC，6.6f，1.6f)，gTexTransform) ; 
vout .TexC = mul(texC, gMatTransform).xy; 














return vout; 





最 后 ， 以 512 x 512 的 栅 格 点 为 例 ， 将 发 布 模 式 (release mode) 下 的 
GPU 实 现 与 CPU 实 现 进行 性 能 的 比 对 。 


6. 索 贝 尔 算 子 〈Sobel Operator) 用 于 图 像 的 边缘 检测 。 它 会 针对 
每 一 个 像素 估算 其 梯度 (gradient〉 的 大 小 。 有 着 较 大 梯度 的 像素 即 表 
明 它 与 周围 像素 的 颜色 差异 极 大 ， 因 而 此 像素 一 定位 于 图 像 的 边缘 。 相 
反 ， 有 具有 较 小 梯度 的 像素 则 意味 着 它 与 临近 像素 的 颜色 趋 于 相同 ， 也 就 
是 说 ， 该 像素 并 不 处 于 图 像 边沿 之 上 。 注意， 索 贝 尔 算 子 返 回 的 并 非 是 
像素 是 人 否 位 于 图 像 边 缘 的 二 元 结果 ， 而 是 一 个 范围 在 [0, 1] 内 表示 边 
治 “ 陡 峭 ? 程 度 的 灰 度 值 : 值 为 0 表示 平坦 ， 即 该 像 系 不 处 于 图 像 边缘 
《该 像素 与 周围 像素 并 没有 颜色 差异 ) ; 值 为 1 则 表示 非常 陡峭 ， 即 该 
像素 处 于 边沿 或 图 像 不 连续 (此 像 系 与 其 周围 像素 的 闫 色差 寞 较 大 ) 。 
索 贝尔 逆 图 像 (1 一 0 往往 会 更 加 直观 有 效 ， 这 时 白色 表示 平坦 且 不 位 于 
图 像 边 缘 ， 而 黑色 则 代表 陡峭 且 处 于 图 像 边沿 〈 见 图 13.14) 。 









































图 13.14 〔 左 图 ) 运用 索 贝 尔 算 子 之 后 的 图 像 效果 ， 和 白色 像 素 表示 图 像 边 缘 。 
( 右 图 ) 在 索 贝 尔 算 子 的 逆 图 像 中 ， 则 用 黑色 像素 表示 图 像 边缘 















































如 末 将 原始 图 像 与 其 经 过 索 贝 尔 算 子 生成 的 敢 图 像 两 者 间 的 对 应 颜 
色 值 相 乘 ， 我 们 将 获得 类 似 于 卡通 画 或 动漫 书 中 那样 ， 其 边缘 就 像 用 黑 
色 的 笔 义 描 后 的 图 片 效 果 《〈 见 图 13.15) 。 我 们 可 以 用 这 种 算 子 实现 上 
述 效 末 ， 哪 介 待 处 理 的 图 像 首 移 经 过 模糊 处 理 后 已 隐 去 了 部 分 细节 ， 依 
旧 可 恢复 其 相对 狂 久 的 画 风 ， 令 其 边缘 明晰 起 来 。 处 理 过 程 是 : 利用 过 
贝尔 算 子 构建 出 模糊 图 像 的 边缘 检测 图 像 ， 再 将 此 勾勒 出 边缘 的 索 贝 尔 
逆 图 像 与 原 模糊 图 像 进行 乘法 运算 。 
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图 13.15 ”将 原始 图 像 与 边缘 检测 的 逆 图 像 相 乘 所 产生 的 如 黑 笔 描绘 图 像 边 缘 的 效果 








现 使 用 泻 染 到 纹理 技术 与 计算 着 色 器 来 实现 索 贝 尔 算 子 。 在 借助 索 
贝尔 算 子 生成 边缘 检测 图 像 之 后 ， 将 其 逆 图 像 与 原始 图 像 相 乘 ， 以 此 来 
得 到 图 13.15 中 所 示 的 效果 。 着 色 器 部 分 需要 含有 下 列 代码 四 。 








Texture2D gInput : register(t6) ; 
RWTexture2D<float4> gOutput : register(uU6) ; 





// 根据 RGB 数据 计算 出 对 应 亮度 (Luminance， 即 “亮度 (brightness)”) 的 近似 值 。 这 些 
权重 是 在 人 
// 眼 对 不 同 光 的 波长 敏感 度 的 实验 基础 之 上 所 得 来 的 
float CalcLuminance(float3 color) 
{ 
return dot(color, float3(60.299f, 86.587f, 0.114f)); 
} 

















[numthreads(16, 16, 1)] 
void SobelCS(int3 dispatchThreadID : SV_DispatchThreadID) 


{ 
// 采集 与 当前 欲 处 理 像 素 相 邻 的 众 像素 


float4 c[3][3]; 
for(int i = 6j i < 3; ++i) 


{ 
for(int j = 6j j < 3; ++j) 
{ 
int2 xy = dispatchThreadID.xy + int2(-1 + j, -1 + i); 
cli][j] = gInput[xy]; 
} 
} 














// 针对 每 个 颜色 通道 ， 运 用 索 贝 尔 公式 估算 出 关于 x 的 偏 导数 近似 值 
float4 Gx = -1.6fxc[6][6] - 2.6f*c[1][6] - 1.6fxc[2][8] + 
1.6f*c[6][2] + 2.6f*c[1][2] + 1.6fxc[2][2]; 





























// 对 于 每 个 颜色 通道 ， 利 用 索 贝 尔 公式 估算 出 关于 y 的 偏 导数 近似 值 
float4 Gy = -1.6fxc[2][6] - 2.6f*c[2][1] - 1.6f*c[2][2] + 
1.6f*c[6][6] + 2.6fxc[6][1] + 1.6fxc[8][2]; 














// 梯度 即 为 (Gx，Gy) 。 针 对 每 个 颜色 通道 ， 计 算出 梯度 的 大 小 《梯度 的 模 ) 以 找到 最 大 
的 变化 率 
float4 mag = sqrt(Gx*Gx + Gy*Gy); 











EY 


// 将 梯度 陡峭 的 边缘 处 绘制 为 黑色 ， 梯 度 平坦 的 非 边 缘 处 绘制 为 白 
mag = 1.6f - saturate(CalcLuminance(mag.rgb)); 














gOutput[dispatchThreadID.xy] = mag; 
} 


Midd tt tt hh 
米 米 炒米 


// Composite.hlsl 的 作者 为 Frank Luna (C) 2615 版 权 所 有 
// 
// 将 两 张 图 像 组 合 在 一 起 


人 /玉米 炒米 米 林 玉 术 米 米 米 玉 炒米 玉米 玉米 米 米 汶 术 米 玉 米 米 炒米 玉米 玉米 米 沙洲 玉米 水 米 米 炒米 炒米 玉米 米 迷 炒米 米 洒 汶 玉 炒米 米 米 玉米 玉米 玉米 米 术 米 玉 米 米 米 水 
米 米 炒米 

















Texture2D gBaseMap : register(to); 
Texture2D gEdgeMap : register(t1); 


SamplerState gsamPpointWrap : register(s6) ; 
SamplerState gsamPointClamp : register(s1); 
SamplerState gsamLinearWrap : register(s2); 
SamplerState gsamLinearClamp : register(s3); 


SamplerState gsamAnisotropicWrap : register(s4); 
SamplerState gsamAnisotropicClamp : register(s5); 


static const float2 gTexCoords[6] = 
{ 


float2(0.6f, 1.6f), 
float2(6.9f，6.6f)， 
float2(1.9f，6.6f)， 
float2(6.9f，1.6f)， 
float2(1.9f，6.6f)， 
float2(1.9f，1.6f) 


}; 


struct VertexOut 


{ 
float4 PosH : SV_POSITION; 


float2 TexC : TEXCOORD; 
}; 
VertexOut VS(uint vid : SV VertexID) 
{ 


VertexOut vout; 


vout.TexC = gTexCoords[vid]; 





// 将 [6,1]^2 区 间 映 射 到 NDC (规格 化 设备 坐标 〉 空 间 

vout.PosH = float4(2.6f*vout.TexC.x - 1.6f, 1.6f - 2.6f*vout.TexC.y, 60.0 
f， 

1.6f); 


return vout; 


} 


float4 PS(VertexOut pin) : SV_Target 


{ 
float4 c = gBaseMap.SampleLevel(gsamPointClamp, pin.TexC, 96.6f); 
float4 e = gEdgeMap.SampleLevel(gsamPointClamp, pin.TexC, 96.06f); 


// 将 边缘 图 与 原始 图 像 相 乘 


return c*e; 





[1] 文中 这 段 讲 述 的 都 是 GPU 的 内 部 结构 ， 请 勿 将 核 忆 显卡 (集成 显卡 
以 及 部 分 独立 显卡 ) 所 共 孚 的 系统 内 存 与 之 混 消 。 





[2] 组 线程 数量 与 分 派 函 数 参数 的 设置 配合 很 有 讲究 ， 直 接 关 平 计算 着 
色 器 的 工作 效率 ! 


[3] 己 被 AMD 公 司 收购 。 





[4] 将 泻 染 (图 形 ) 流水 线 与 计算 流水 线 视 作 两 种 不 同 的 流水 线 。 另 
外 ，D3D12_COMPUTE_PIPELINE_STATE_DESC 结 构 体 共有 5 个 字段 ， 由 
于 没有 涉及 其 他 两 个 的 有 关 技 术 《〈 如 多 GPU) ， 所 以 并 未 提 及 。 


[5] 前 面谈 到 了 演 染 (图 形 ) 流水 线 与 计算 流水 线 的 区 别 ， 那 么 对 应 的 
绘制 请 求 与 线程 组 分 派 也 就 分 别 被 称 之 为 “绘制 调用 (draw call) ”与 “分 
派 调用 〈dispatch call， 调 度 调 用 ) ”。 


[6] 微软 文档 上 写 D3D10 与 D3D11 中 支持 组 内 共享 内 存 分 别 为 16kb 与 
32kb， 本 书 原文 也 记 作 kb。NVIDIA 文 档 上 上 却 写 D3D10 与 D3D11 中 支 
持 组 内 共享 内 存 分 别 为 16KB 与 32KB。 而 2010 年 AMD Radeon HD 2000 
系列 的 文档 中 也 提出 ，shader model 4.0 (对 应 DirectX 10) 与 Shader 
model 5.0 (对 应 DirectX 11) 分别 支持 组 内 共 吾 内 存 为 16KB 与 32KB。 
尽管 通过 文档 下 文 (及 惯用 法 ) 可 以 推 朵 KB 表示 的 是 kilobyte 〈 干 字 
) ， 但 是 粗 看 还 是 容易 产生 芝 义 性 。 





贡 
[7] 本 章 所 讨论 的 计算 着 色 器 (compute shader) 又 称 DirectCompute 技 
术 ( 有 了 时 写作 Direct Compute) 。 在 DirectX 10 中 仪 支持 部 分 功能 子 集 


(DirectCompute 4.0) ， 于 DirectX 11 中 正式 初次 发 表 完 整 功能 版 本 
(DirectCompute 5.0) 。 





[8] 简单 来 说 ， 梯 度 从 本 质 上 来 讲 也 是 一 种 向 量 ， 借 助 其 长 度 〈 即 模 ) 
就 可 以 反映 出 《像素 值 间 的 ) 变化 程度 ， 从 而 确定 当前 像素 是 否 处 于 变 
化 剧烈 的 图 像 分 割 边 缘 。 索 贝尔 算 子 与 高 斯 模糊 的 算法 有 些 相 似 ， 也 是 











根据 样本 周围 的 像素 值 进行 加 权 处 理 ， 只 不 过 根据 功能 不 同 ， 因 而 权重 
取 值 不 同 ， 且 计算 的 是 梯度 有 关 数 据 。 书 中 忽略 了 其 推导 过 程 与 具体 算 
法 细节 描述 ， 直 接 给 出 了 代码 ， 欲 知 详情 可 查询 有 关 文 献 。 译 者 认为 顶 
点 着 色 器 VS 中 将 y 轴 从 [0,1] 区 间 向 NDC 空 间 变 换 的 代码 存疑 ， 如 果 按 照 
其 代码 所 示 ，y 轴 坐标 将 个 变换 至 区 间 [1-2*0,1-2*1]， 即 区 间 [1,-1]。 


第 14 章 ”曲面 细 分 阶段 


曲面 细 分 阶段 叫 (tessellation stage， 直 译作 镶嵌 阶段 或 灸 角 化 处 理 
阶段 ， 是 指 演 染 流水 线 中 参与 对 几何 图 形 进行 镶 散 处 理 (tessellating 
geometry) 的 3 个 阶段 。 简 而 言 之 ， 曲 面 细 分 技术 束 是 将 几何 体 细 分 为 
更 小 的 三 角形 ， 并 以 某 种 方式 把 这 些 新 生成 的 顶点 偏 移 到 合适 的 位 置 ， 
从 而 以 增加 三 角形 数量 的 方式 丰富 网 格 的 细节 。 但 是 ， 为 什么 不 在 创建 
网 格 之 初 就 直接 赋予 它 高 模 (high-poly， 高 多 边 形 ) 的 细节 呢 ? 以 下 是 
使 用 曲面 细 分 的 3 个 理由 。 








1. 基于 GPU 实现 动态 LOD (Level of Detail， 细 节 级 别 ) 。 可 以 根 
据 网 格 与 摄像 机 的 距离 或 依据 其 他 因素 来 调整 其 细节 。 比 如 说 ， 大 网 格 
离 摄像 机 较 远 ， 则 按 高 模 的 规格 对 它 进 行 泻 染 将 是 一 种 浪费 ， 因 为 在 那 
个 距离 我 们 根本 看 不 清 网 格 所 有 细节 。 随 痢 物 体 与 摄像 机 之 间距 离 的 拉 
近 ， 我 们 就 能 连续 地 对 它 镶 舱 细 分 ， 以 增加 物体 的 细节 。 


2. 物理 模拟 与 动画 特效 。 我 们 可 以 在 低 模 〈low-poly， 也 有 译作 低 
面 多 边 形 等 ) 网 格 上 执行 物理 模拟 与 动画 特效 的 相关 计算 ， 再 以 镶 骨 化 
处 理 手 段 来 获取 细 市 更 加 丰富 的 网 格 。 这 种 降低 物理 模拟 与 动画 特效 计 
算 量 的 做 法 能 够 节省 不 少 的 计算 资源 。 


3. 节约 内 存 。 我 们 可 以 在 各 种 存储 器 (磁盘 、RAM 与 VRAM) 中 
保存 低 模 网 格 ， 再 根据 需求 用 GPU 动 态 地 对 网 格 进行 镶 风 细 分 。 


图 14.1 展 示 了 位 于 顶点 着 色 需 与 几何 着 色 器 之 间 的 曲面 细 分 阶 ， 但 
本 书 在 此 章 之 前 从 未 用 到 过 它们 ， 由 此 可 见 ， 这 3 个 阶段 都 是 可 选 的 。 


学 习 目 标 : 
1. 了 解 曲面 细 分 所 用 的 面 片 图 元 类 型 。 


2. 理解 曲面 细 分 阶段 中 的 每 个 步 又 都 做 了 什么 ， 它 们 所 需 的 输入 
及 输出 又 分 别 是 哪 种 数据 。 





3. 通过 编写 外 这 着 色 咒 与 域 着 色 器 程序 来 对 儿 何 图 形 进行 镶 欣 化 
细 分 。 

4， 见 悉 不 同 的 细 分 策略 ， 以 便 在 镶 谍 化 处 理 时 选择 出 最 适当 的 方 
案 。 除 此 之 外 ， 还 要 知晓 人 硬件 曲面 细 分 的 性 能 。 


5. 学 习 贝 喜 尔 曲线 与 贝 豆 尔 曲面 的 数学 描述 ， 并 在 曲面 细 分 阶段 
将 它们 予以 实现 。 





图 14.1 图 中 展示 的 演 染 流水 线 子 集 便 是 曲面 细 分 阶段 〈 即 处 于 中 间 位 置 的 3 个 演 染 步骤 ) 





14.1 曲面 细 分 的 图 元 类 型 


在 进行 曲面 细 分 时 ， 我 们 并 不 向 IA“〈 输 入 装配 ) 阶段 提交 三 角形 ， 
而 是 提交 具有 若干 控制 点 〈control point) 的 面 片 (patch) 。Direct3D 文 
持 具 有 1 一 32 个 控制 点 的 面 片 ， 并 以 下 列 图 元 类 型 进行 描述 。 








D3D_PRIMITIVE_TOPOLOGY 1_CONTROL_POINT_PATCHLIST 
D3D_PRIMITIVE_TOPOLOGY _2_CONTROL_POINT_PATCHLIST 
D3D_PRIMITIVE_TOPOLOGY 3_CONTROL_POINT_PATCHLIST 
D3D_PRIMITIVE_TOPOLOGY 4 CONTROL_POINT_PATCHLIST 


D3D_PRIMITIVE_TOPOLOGY_31 CONTROL_POINT_PATCHLIST 
D3D_PRIMITIVE_TOPOLOGY 32_CONTROL_POINT_PATCHLIST 








由 于 可 以 将 三 角形 看 作 是 拥有 3 个 控制 点 的 三 角形 面 片 
(CD3D_PRIMITIVE_3_CONTROL_POINT_PATCH) ， 所 以 我 们 依然 可 以 
提交 需要 灸 典 化 处 理 的 普通 三 角形 网 格 。 对 于 简单 的 四 边 形 面 片 而 言 ， 
则 只 需 提 交 具 有 4 个 控制 点 的 面 片 
(D3D_PRIMITIVE_4_CONTROL_POINT_PATCH) 即 可 。 这 些 面 片 最 终 
也 会 在 曲面 细 分 阶段 经 镶 舱 化 处 理 而 分 解 为 多 个 三 角形 加。 





注 意 Note Wi 


在 问 ID3D12GraphicsCommandList::IASetPrimitiveTopology 
方法 传递 控制 点 图 元 类 型 时 ， 我 们 还 需 


将 D3D12_GRAPHICS_PIPELINE_STATE_DESC: :Primitive- 
TopologyType 字 段 设 置 

为 D3D12_PRIMITIVE_TOPOLOGY _TYPE_PATCH， 如 : opaque- 
PsoDesc.PrimitiveTopologyType=D3D12 PRIMITIVE TOPOLOGY_TY 


那么 ， 上 其 有 更 多 控制 点 的 面 片 义 有 什么 用 处 呢 ?” 控 制 点 的 概念 来 目 
于 特定 种 类 数学 曲线 或 数学 曲面 的 构造 过 程 。 如 果 在 类 似 于 Adobe 
Ilustrator 这 样 的 绘图 程序 中 使 用 过 贝 竖 尔 曲线 工具 ， 那 读者 一 定 会 知道 
要 通过 控制 点 才能 描绘 出 曲线 形状 。 在 数学 上 ， 可 以 利用 贝 塞 尔 曲线 来 
生成 贝 赛 尔 曲面 。 举 个 例子 ， 我 们 可 以 用 9 个 控制 点 或 16 个 控制 点 来 创 
建 一 个 贝 塞 尔 四 边 形 面 片 ， 所 用 的 控制 点 越 多 ， 我 们 对 面 片 形状 的 控制 
也 惑 越 随 心 所 欲 。 因 此 ， 这 一 切 图 元 控制 类 型 都 是 为 了 给 这 些 不 同 种 类 
的 曲线 、 曲 面 的 绘制 提供 文 持 。 我 们 会 在 本 章 给 出 贝 竖 尔 四 边 形 面 片 的 
示例 以 及 相关 解释 。 





曲面 细 分 与 项 点 看 色 妖 


在 我 们 回 泻 染 流水 线 提交 了 面 片 的 控制 点 后 ， 它 们 就 会 被 推送 至 顶 
点 着 色 器 。 这 样 一 来 ， 在 开局 曲面 细 分 之 时 ， 顶 点 着 色 器 就 彻底 沦陷 
为 “处 理 控制 点 的 着 色 器 ?”。 正 因 如 此 ， 我 们 还 能 在 曲面 细 分 开展 之 前 ， 
对 控制 点 进行 一 些 调整 。 一 般 来 讲 ， 动 画 与 物理 模拟 的 计算 工作 都 会 在 
对 几何 体 进 行 镶 庶 化 处 理 之 前 的 顶点 着 色 器 中 以 较 低 的 频次 进行 〈 镶 名 


化 处 理 后 ， 顶 点 增多 ， 处 理 的 频次 也 将 随 之 增加 ) 。 


14.2 ”外壳 着 色 喜 


在 以 下 小 节 中 ， 我 们 会 探索 外 过 着 色 右 (hull shader) ， 它 实际 上 
是 由 两 种 着 色 器 (phase) 组 成 的 : 


常量 外 壳 着 色 器 。 





2. 控制 点 外 过 着 色 器 


14.2.1 常量 外 党 着 色 器 


和 常量 外 党 着 色 器 (constant hull shader) 会 针对 每 个 面 片 逐一 进行 处 
理 〈 即 每 处 理 一 个 面 片 就 被 调用 一 次 ) ， 它 的 任务 是 输出 网 格 的 曲面 细 
分 因子 (tessellation factor， 也 有 译作 细 分 因子 、 镶 内 因 子 等 ) 。 曲 面 细 
分 因子 指示 了 在 曲面 细 分 阶段 中 将 面 片 镶 峙 处 理 后 的 份 数 。 下 面 是 一 个 
具有 4 个 控制 点 的 四 边 形 面 片 quad patch) 示例 ， 我 们 将 它 从 各 个 方面 
均匀 地 镶嵌 细 分 为 3 份 。 








struct PatchTess 


float EdgeTess[4] : SV_TessFactonr; 
float InsideTess[2] : SV_InsideTessFactor; 

















// 可 以 在 下 面 为 每 个 面 片 附加 所 需 的 额外 信息 
}; 


PatchTess ConstantHS(InputPatch<VertexOut，4> patch, 
uint patchID : SV_PrimitiveID) 


PatchTess pt; 


将 该 面 片 从 各 方面 均匀 地 镶 典 处 理 为 3 等 份 


3; // 四 边 形 面 片 的 左 侧 边缘 
3; // 四 边 形 面 片 的 上 侧 边缘 
3; F 
3; 


/ 


~ 


pt.EdgeTess[6] 
pt.EdgeTess[1] 
pt.EdgeTess[2] 
pt.EdgeTess[3] 


// 四 边 形 面 片 的 右 侧 边缘 
// 四 边 形 面 片 的 下 侧 边 毕 


3; // u 轴 (四 边 形 内 部 细 分 的 列 数 ) 
3; // v 轴 《四 边 形 内 部 细 分 的 行 数 ) 








pt.InsideTess[6] 
pt.InsideTess[1] 








return pt; 





常量 外 壳 着 色 器 以 面 片 的 所 有 控制 点 作为 输入 ， 在 此 
用 InputPatch<VertexOut ，4> 对 此 进行 定义 。 前 面 提 到 ， 控 制 点 首先 
会 传 至 顶点 着 色 器 ， 因 此 它们 的 类 型 由 顶点 着 色 器 的 输出 类 型 
VertexOut 来 确定 。 在 此 例 中 ， 我 们 的 面 片 拥有 4 个 控制 点 ， 所 以 就 
将 InputPatch 模 板 的 第 二 个 参数 指定 为 4。 系 统 还 通过 
SV_PrimitiveID 语 义 提供 了 面 片 的 ID 值 ， 此 ID 唯一 地 标识 了 绘制 调用 
过 程 中 的 各 个 面 片 ， 我 们 可 根据 具体 的 震 求 来 运用 它 。 常 量 外 沉着 色 器 
必须 输出 曲面 细 分 因子 ， 该 因子 取决 于 面 厂 的 拓扑 结构 。 





注 意 Note i 


除了 曲面 细 分 因子 (SV_TessFactor 与 SV_InsideTessFactor,， 
分 别 表示 几何 图 形 边缘 与 内 部 的 细 分 份 数 ) 之 外 ， 我 们 还 能 令 和 常量 外 膏 
着 色 串 输出 其 他 的 面 片 信息 。 域 着 色 器 接收 来 自 常 量 外 党 着 色 器 的 输出 
数据 作为 输入 ， 继 而 使 用 这 些 额外 的 面 片 信息 。 








对 四 边 形 面 片 进行 镶 租 化 处 理 的 过 程 由 两 个 部 分 构成 : 
1. 4 个 边缘 曲面 细 分 因子 控制 着 对 应 边缘 镶 肉 后 的 份 数 。 


2. 两 个 内 部 曲面 细 分 因子 指示 了 如 何 来 对 该 四 边 形 面 片 的 内 部 进 
行 镶 衣 化 处 理 〈 一 个 曲面 细 分 因子 针对 四 边 形 的 横 回 维度 ， 另 一 个 则 作 
用 于 四 边 形 的 纵向 维度 )〉。 


在 14.3 节 中 ， 图 14.2 所 示 的 例子 展示 了 使 用 不 同 的 曲面 细 分 因子 会 
生成 结构 各 寞 的 四 边 形 面 片 。 届 时 我 们 将 研究 这 儿 组 示例 ， 直 到 对 边 毕 
与 内 部 这 两 种 曲面 细 分 因子 的 工作 原理 了 如 指 掌 。 


对 三 角形 面 片 triangle patch) 执行 镶嵌 化 处 理 的 过 程 同 样 分 为 两 


部 分 : 


了 Ht 


1. 3 个 边缘 曲面 细 分 因子 控制 着 对 应 边 上 灸 典 后 的 份 数 。 


2. 一 个 内 部 曲面 细 分 因子 指示 着 三 角形 面 片 内 部 的 镶 骨 份 数 。 








在 14.3 节 中 ， 图 14.3 所 示 的 例子 即 通 过 不 同 的 曲面 细 分 因子 最 终 得 
到 的 结构 各 异 的 三 角形 面 亡 。 


Direct3D 11 便 件 所 支持 的 最 大 曲面 细 分 因子 为 64S1。 如 果 把 所 有 的 
曲面 细 分 因子 都 设置 为 0， 则 该 面 片 会 被 后 续 的 处 理 阶段 丢弃 。 这 就 使 
我 们 能 够 以 每 个 面 厂 为 基准 来 实现 如 视 锥 体 剔 除 〈frustum culling) 与 背 
面 吻 除 这 类 优化 。 


1. 如 果 面 片 根 本 没有 出 现在 视 锥 体 范围 内 ， 那 么 就 能 将 它 从 后 续 
的 处 理 中 丢弃 《〈 倘 各 已 经 对 该 面 片 进行 了 镶 钢 化 处 理 ， 那 么 其 细 分 后 的 
各 三 角形 将 在 三 角形 裁剪 〈triangle clipping) 期 间 被 抛弃 )。 


2. 如 果 面 片 是 背面 朝向 的 ， 那 么 就 能 将 其 从 后 面 的 处 理 过 程 中 丢 
弃 《 如 果 该 面 片 已 经 过 了 镶 远 化 处 理 ， 则 其 细 分 后 的 诸 三 角形 会 在 光栅 
化 阶段 的 背面 吻 除 过 程 中 被 遗弃 )。 





一 个 问题 自然 而 然 地 浮现 出 来 : 到 属 应 该 执行 儿 次 镶 授 化 处 理 才 合 
适 ? 前 面 提 到 ， 曲 面 细 分 的 基本 想法 就 是 为 了 丰富 网 格 的 细 市 。 但 是 ， 
如 果 用 户 对 此 无 感 ， 我 们 就 不 必 无 请 地 为 它 增添 细 方 了。 以 下 是 一 些 确 
定 镶 肉 次 数 的 种 用 衡量 标准 。 


1. 根据 与 摄像 机 之 间 的 距离 : 物体 与 摄像 机 的 距离 越 远 ， 能 分 辩 
的 细节 就 越 少 。 因 此 ， 我 们 在 两 者 距离 较 远 时 泻 染 物体 的 低 模 版 本 ， 并 
随 着 两 者 逐渐 接近 而 逐步 对 物体 进行 更 加 细致 的 镶 骨 化 细 分 。 


2. 根据 占用 屏幕 的 范围 : 可 以 先 估算 出 物体 履 兰 屏幕 的 像素 个 
数 。 如 果 数 量 比较 少 ， 则 演 染 物体 的 低 模版 本 。 随 着 物体 占用 屏幕 范围 
的 增加 ， 我 们 便 可 以 逐渐 增 大 镶 典 化 细 分 因子 。 


3. 根据 三 角形 的 朝 癌 : 三 角形 相对 于 观察 者 的 朝 回 也 被 列 入 考虑 
的 范畴 之 中 。 位 于 物体 轮 廊 边缘 (silhouette edge) [上 的 三 角形 势必 比 
其 他 位 置 的 三 角形 拥有 更 多 的 细节 。 











4. 根据 粗糙 程度 : 粗糙 不 平 的 表面 较 光 滑 的 表面 需要 进行 更 为 细 


致 的 曲面 细 分 处 理 。 通 过 对 表面 纹理 进行 检测 可 以 预算 出 相应 的 粗糙 度 
数据 ， 继 而 来 决定 镶 让 化 处 理 的 次 数 。 


[Story10] 给 出 了 以 下 几 点 关于 性 能 的 建议 。 


1. 如 果 曲 面 细 分 因子 为 1 (这 个 数值 其 实意 味 着 该 面 片 不 必 细 
分 ) ， 那 么 就 考虑 在 洽 染 此 面 片 时 不 对 它 进行 细 分 处 理 ， 否 则 ， 便 会 在 
曲面 细 分 阶段 白白 浪费 GPU 资 源 ， 因 为 在 此 阶段 并 不 对 其 执行 任何 操 
作 。 





2. 考虑 到 性 能 又 涉及 GPU 对 曲面 细 分 的 具体 实现 ， 所 以 不 要 对 小 
于 8 个 像素 这 种 过 小 的 三 角形 进行 镶 衣 化 处 理 。 


3. 使 用 曲面 细 分 技术 时 要 采用 批 绘制 调用 〈batch draw call， 即 尽 
量 将 曲线 细 分 任务 集中 执行 ) 〈 在 绘制 调用 之 间 往 复 开 局 、 关 闭 曲 面 细 
分 功能 的 代价 极其 高 郧 〉。 


14.2.2 ”控制 点 外 壳 着 色 器 








控制 点 外 壳 着 色 器 〈control point hull shader) 以 大 量 的 控制 点 作为 
输入 与 输出 ， 每 输出 一 个 控制 点 ， 此 着 色 器 都 会 被 调用 一 次 。 该 外 沉着 
色 占 的 应 用 之 一 是 改变 曲面 的 表示 方式 ， 比 如 说 把 一 个 普通 的 三 角形 
《 回 演 染 流水 线 提交 的 3 个 控制 点 ) 转换 为 3 次 贝 窗 尔 三 角形 面 片 《cubic 
Bézier triangle patch， 即 一 种 具有 10 个 控制 点 的 面 片 ) 。 例 如 ， 假 设 我 
们 像 平常 那样 利用 《有 具有 3 个 控制 点 的 ) 三 角形 对 网 格 进行 建 模 ， 就 可 








以 通过 控制 点 外 壳 着 色 器 ， 将 这 些 三 角形 转换 为 具有 10 个 控制 点 的 高 阶 
三 次 贝 蹇 尔 三 角形 面 片 。 新 增 的 控制 点 不 仅 会 带 来 更 丰富 的 细节 ， 而 且 
能 将 三 角形 面 片 镶 骨 细 分 为 用 户 所 期 望 的 份 数 。 这 一 策略 被 称 为 N- 
patches 方 法 (法 线 一 面 片 方 法 ，normal-patches scheme) 或 PN 三 角形 方 
法 《〈 即 《曲面 ) 点 一 法 线 三 角形 方法 ，〈curved) point-normal 
triangles， 人 简 记 作 PN triangles scheme) [Vlachos01]。 由 于 这 种 方案 只 需 
用 曲面 细 分 技术 来 改进 已 存在 的 三 角形 网 格 ， 且 无 须 改动 美术 制作 流 
程 ， 所 以 实现 起 来 比较 方便 。 对 于 本 章 第 一 个 演示 程序 来 说 ， 控 制 点 外 
过 着 色 器 仪 充当 一 个 简单 的 传递 着 色 器 (pass-through shader) ， 它 不 会 
对 控制 点 进行 任何 的 修改 。 














注 意 Note i 


驱动 程序 可 能 会 对 传递 着色 器 进行 检测 与 优化 [Bilodeau10b]。 





struct HullOut 


float3 PosL : POSITION; 
}; 


[domain("quad" ) ] 
[partitioning("integer")] 
[outputtopology("triangle cw")] 
[outputcontrolpoints(4)] 
[patchconstantfunc("ConstantHS")] 
[maxtessfactor(64.6f)] 
HullOut HS(CInputPatch<VertexOut，4> p， 
uint i : SV_OutputControlPointID， 
uint patchId : SV_PrimitiveID) 


HullOut hout ; 


hout .PosL = p[i].PosL; 


Peturn hout ; 





通过 InputPatch 参 数 即 可 将 面 片 的 所 有 控制 点 都 传 至 外 充 着 色 器 
之 中 。 系 统 值 SV_0utputControlPointID 索 引 的 是 正在 被 外 壳 着 色 器 
所 处 理 的 输出 控制 点 。 值 得 注意 的 是 ， 输 入 的 控制 点 数量 与 输出 的 控制 
点 数量 未 必 相 同 。 例 如 ， 输 入 的 面 刻 可 能 仅 含 有 4 个 控制 点 ， 而 输出 的 
面 请 却 能 够 拥有 16 个 控制 点 ， 意 即 ， 这 些 多 出 来 的 控制 点 可 由 输入 的 4 
个 控制 点 所 衍生 。 




















上 面 的 控制 点 外 壳 着 色 器 还 用 到 了 以 下 几 种 属性 。 


1. domain: 面 片 的 类 型 。 可 选用 的 参数 有 tri (三 角形 面 
片 )、quad〔 四 边 形 面 片 ) 或 isoline (等 值 线 ) 。 


2. partitioning: 指定 了 曲面 细 分 的 细 分 模式 。 





a、，jinteger。 新 顶点 的 添加 或 移 除 仅 取 诀 于 曲面 细 分 因子 的 整数 
部 分 ， 而 忽略 它 的 小 数 部 分 。 这 样 一 来 ， 在 网 格 随 着 曲面 细 分 级 别 而 改 
变 时 ， 会 容易 发 生 明 显 的 突 跃 (popping) 的 情况 中 1。 


b. 非 整 型 曲面 细 分 (fractional even/fractional odd) 。 新 
顶点 的 添加 或 移 除 取决 于 曲面 细 分 因子 的 整数 部 分 ， 但 是 细微 的 渐 
变 “ 过 渡 ? 调 整 承 要 根据 因子 的 小 数 部 分 。 当 我 们 希望 将 粗糙 的 网 格 经 曲 








面 细 分 而 平滑 地 过 渡 到 具有 更 佳 细 市 的 网 格 时 ， 该 参数 就 派 上 用 场 了 。 
理解 整 型 细 分 与 非 整 型 细 分 之 间 差 别 的 最 佳 方 式 就 是 通过 动画 实际 演 
示 、 比 对 ， 因 此 ， 本 章 末 会 有 相应 的 练习 来 令 读者 比较 两 者 的 差异 。 











3. outputtopology: 通过 细 分 所 创 的 三 角形 的 绕 序 [61。 
a. triangle_cw: 顺 时 针 方 向 的 绕 序 。 

b. triangle_ccw: 道 时 针 方 向 的 绕 序 。 

c. 1ine: 针对 线段 曲面 细 分 。 


4. outputcontrolpoints: 外 壳 着 色 器 执行 的 次 数 ， 每 次 执行 都 
输出 1 个 控制 点 。 系 统 值 SV_0utputControlPointID 给 出 的 索引 标明 了 
当前 正在 工作 的 外 壳 着 色 器 所 输出 的 控制 点 。 











5.patchconstantfunc: 指定 常量 外 壳 着 色 器 函数 名 称 的 字符 
串 。 


6. maxtessfactor: 告知 驱动 程序 ， 用 户 在 着 色 器 中 所 用 的 曲面 
细 分 因子 的 最 大 值 。 如 果 人 硬件 知道 了 此 上 限 ， 便 可 了 解 曲面 细 分 所 需 的 
资源 ， 继 而 就 能 在 后 台 对 此 进行 优化 。Direct3D 11 硬 件 支 持 的 曲面 细 分 
因子 最 大 值 为 64。 


14.3” 乌 藤 器 阶段 


程序 员 无 法 对 灸 诬 器 [这 一 阶段 进行 任何 控制 ， 因 为 这 一 步骤 的 操 
作 全 权 交 由 硬件 处 理 。 此 环节 会 基于 常量 外 壳 着 色 器 程序 所 输出 的 曲面 
细 分 因子 ， 对 面 片 进行 镶 咀 化 处 理 。 图 14.2 和 图 14.3 详 细 展 示 了 根据 不 
同 的 曲面 细 分 因子 ， 对 四 边 形 面 片 与 三 角形 面 片 所 进行 的 不 同 细 分 操 
1 

















14.3.1 四 i 





图 14.2 ”基于 不 同 的 边缘 细 分 因子 以 及 内 部 细 分 因子 对 四 边 形 细 分 的 示意 图 





14.3.2 三 角形 面 片 的 曲面 细 分 示例 













pt.EdgeTess[0] = 4; 
pt.EdgeTess[1] = 4; 
pt.EdgeTess[2] = 4; 


pt.EdgeTess[0] = 1; 
pt.EdgeTess[1] = 2; 
pt.EdgeTess[2] = 3; 


ptInsideTess = 4; pt.InsideTess = 4; 


pt.EdgeTess[0] = 6; 
pt.EdgeTess[1] = 6; 
pt.EdgeTess[2] = 6; 


pt.EdgeTess[0] = 6; 
pt.EdgeTess[1] = 12; 
pt.EdgeTess[2] = 3; 


pt.InsideTess = 3; pt.InsideTess = 1; 





图 14.3 ”基于 不 同 的 边缘 细 分 因子 以 及 内 部 细 分 因子 对 三 角形 细 分 的 示意 图 








14.4 ” 域 厦 色 器 


镶 庶 器 阶段 会 输出 新 建 的 所 有 顶点 与 三 角形 ， 在 此 阶段 所 创建 顶 
点 ， 都 会 逐一 调用 域 着 色 器 (domain shader) 进行 后 续 处 理 。 随 着 曲面 
田 分 功能 的 开启 ， 顶 点 着 色 器 便 化 身 为 "处理 每 个 控制 点 的 顶点 着 色 
器 ”， 而 外 壳 着 色 器 [的 本 质 实 为 “针对 已 经 过 镶 舱 化 的 面 片 进行 处 理 的 
顶点 着 色 器 ”。 特 别 是 ， 我 们 可 以 在 此 将 经 镶 峙 化 处 理 的 面 片 项 点 投射 

到 齐 次 裁剪 空间 。 





对 于 四 边 形 面 片 来 讲 ， 域 着 色 器 以 曲面 细 分 因子 (还 有 一 些 来 自 常 
量 外 党 着 色 器 所 输出 的 每 个 面 片 的 附加 信息 〉、 控 制 点 外 党 着 色 器 所 输 
出 的 所 有 面 片 控 制 点 以 及 镶 骨 化 处 理 后 的 项 点 位 置 参数 坐标 (ww, 作为 输 
入 。 注 意 ， 域 着 色 器 给 出 的 并 不 是 针 舱 化 处 理 后 的 实际 顶点 位 置 ， 而 是 
Ts x 间 〈patch domain space) 内 的 参数 坐标 (u,vu)( 见 图 
14.4) 。 是 否 利 用 这 些 参 数 坐 标 以 及 控制 点 来 求 取 真正 的 3D 顶 点 位 置 ， 
oe 
interpolation， 其 工作 原理 与 纹理 的 线性 过 滤 相 似 ) 来 实现 这 一 




















图 14.4 “对 具有 4 个 控制 点 的 四 边 形 面 片 进行 细 分 ， 以 生成 坐标 位 于 范围 0，]] 内 的 规范 化 tu 空 
间 中 的 16 个 顶点 








struct DomainOut 


float4 PosH : SV_POSITION; 
}; 


// 每 当 灸 嵌 器 (tessellator) 创建 顶点 时 都 会 调用 域 着 色 器 。 
// 可 以 把 它 看 作 镶 嵌 处 理 阶段 后 的 “顶点 着 色 器 ” 
[domain("quad " ) ] 
DomainOut DS(PatchTess patchTess， 

float2 uv : SV DomainLocation, 

const OutputPpatch<HullOut, 4> quad) 




















DomainOut dout; 


// 双 线 性 插值 

float3 v1 = lerp(quad[8].PosL, quad[1].PosL, uv.x); 
float3 v2 = lerp(quad[2].PosL, quad[3] .PosL, uv.x); 
float3 p lerp(v1l, v2, UVv.y); 





float4 posW = mul(float4(p, 1.6f), gWorld); 
dout.PosH = mul(posW, gViewpPro]j); 


return dout; 





注 意 Note 和 


如 图 14.4 所 示 ， 四 边 形 面 片 的 控制 点 顺 友 是 一 行 紧 接着 一 行 ( 逐 
行 ) 排列 的 。 





域 着 色 圳 处理 三 角形 面 片 的 方法 与 处 理 四 边 形 面 片 的 方法 很 相似 ， 


只 是 把 顶点 用 类 型 为 float3 的 重心 坐标 ("如来 表示 ， 以 此 作为 域 着 
色 器 的 输入 (与 重心 坐标 相关 的 数学 内 容 请 参见 附录 C.3 节 ) ， 从 而 取 
代 参 数 坐 标 \u.v)。 将 三 角形 面 片 以 重心 坐标 作为 输入 的 原因 ， 很 可 能 是 
因为 贝 窄 尔 三 角形 面 片 都 是 用 重心 坐标 来 定义 所 导致 的 。 











14.5 ”对 四 边 形 进行 镶 诅 化 处 理 





作为 本 章 中 的 第 一 个 演示 程序 ， 我 们 在 其 中 辣 泻 染 流 水 线 提交 了 一 
个 四 边 形 面 片 ， 根 据 此 面 片 与 摄像 机 之 间 的 距离 对 它 进行 镶 座 处 理 ， 再 
通过 类 似 于 之 前 示例 中 用 于 构造 “ 山 丘 ”的 数学 函数 对 生成 的 顶点 进行 平 


移 。 








按照 如 下 方法 创建 存 有 4 个 控制 点 的 顶点 缓冲 区 。 





void BasicTessellationApp::BuildQuadPatchGeometry() 


{ 
std::array<XMFLOAT3,4> vertices = 


{ 
XMFLOAT3(-16.6f，6.6f，+16.6f)， 
XMFLOAT3(+16.6f，6.6f，+16.6f)， 
XMFLOAT3(-16.6f，6.6f，-16.6f)， 
XMFLOAT3(+16.9f，6.6f，-16.6f) 


}; 


std::array<std::int16 t, 4> indices = { 60, 1, 2, 3 }; 


const UINT vbByteSize 
const UINT ibByteSize 


(UINT)vertices.size() * sizeof(Vertex); 
(UINT)indices.size() * sizeof(std::uint16 t); 


auto geo = std::make unique<MeshGeometry>(); 
geo->Name = "quadpatchGeo"; 


ThrowIfFailed(D3DCreateBlob(vbByteSize, &geo->VertexBufferCPU)); 
CopyMemory (geo->VertexBufferCPU->GetBufferpointer(), vertices.datal(), 
vbByteSize); 


ThrowIfFailed(D3DCreateBlob(ibByteSize, &geo->IndexBufferCPU)); 
CopyMemory (geo->IndexBufferCPU->GetBufferpointer(), indices.data(), 
ibByteSize); 


geo->VertexBufferGPU = d3dUtil::CreateDefaultBuffer(md3dDevice.Get(), 
mCommandList.Get(), vertices.data(), vbByteSize, 
geo->VertexBufferUploader); 


geo->IndexBufferGPU = d3dUtil::CreateDefaultBuffer(md3dDevice.Get(), 
mCommandList.Get(), indices.data(), ibByteSize, 
geo->IndexBufferUploader); 


geo->VertexByteStride = sizeof(XMFLOAT3); 
geo->VertexBufferByteSize = vbByteSize; 
geo->IndexFormat = DXGI FORMAT_ R16_UINT; 
geo->IndexBufferByteSize = ibByteSize; 


SubmeshGeometry quadSubmesh; 
quadSubmesh.IndexCount = 4; 
quadSubmesh.StartIindexLocation = 0; 
quadSubmesh.BaseVertexLocation = 0; 


geo->DrawArgs["quadpatch"] = quadSubmesh; 


mGeometries[geo->Name] = std::move(geo); 





四 边 形 面 片 的 泻 染 项 创建 如 下 : 


void BasicTessellationApp::BuildRenderItems() 
{ 
auto quadPatchRitem = std::make unique<RenderItem>(); 
quadPatchRitem->World = MathHelper::Identity4x4(); 
quadPatchRitem->TexTransform = MathHelper::Identity4x4(); 
quadPatchRitem->0bjCBIndex = 6; 
quadPatchRitem->Mat = mMaterials["whiteMat"].get(); 
quadPatchRitem->Geo = mGeometries["quadpatchGeo"] .get() 
quadPatchRitem->PrimitiveType = D3D_PRIMITIVE_TOPOLOGY 4 CONTROL _ 
POINT_PATCHLIST ; 
quadPatchRitem->IndexCount = quadPatchRitem->Geo- 
>DrawArgs["quadpatch"].IndexCount; 
quadPatchRitem->StartIindexLocation = 
quadPatchRitem->Geo->DrawArgs["quadpatch"].StartIindexLocation; 
quadPatchRitem->BaseVertexLocation = 
quadPatchRitem->Geo->DrawArgs["quadpatch"].BaseVertexLocation; 
mRitemLayer[(int)RenderLayer::Opaque].push back(quadPatchRitem. get()); 


mAllRitems.push back(std: :move(quadPatchRitem) ) ; 





现在 我 们 把 注意 力 转 移 到 外 党 着 色 嚣 上。 该 外 沈 着 色 器 与 14.2.1 市 


及 14.2.2 节 中 介绍 的 比较 相近 ， 不 同 之 处 仅 在 于 现在 要 根据 观察 点 与 网 
格 的 距离 来 确定 曲面 细 分 因子 。 这 背后 所 隐藏 的 想法 即 网 格 与 观察 点 之 
间距 离 较 远 时 采用 低 模 网 格 ， 并 随 着 两 者 逐步 接近 而 增加 镶嵌 的 次 数 
(继而 增加 了 网 格 中 的 三 角形 个 数 ， 整 个 过 程 如 图 14.5 所 示 》。 








图 14.5 ”网 格 细 分 的 次 数 随 着 观察 者 与 之 距离 的 拉 近 而 增加 





struct VertexIn 


float3 PosL : POSITION; 
}; 


struct VertexOut 


float3 PosL : POSITION; 
}; 
VertexOut VS(VertexIn vin) 
VertexOut vout; 
vout.PosL = vin.PostL; 


return vout,; 


} 
struct PatchTess 


float EdgeTess[4] : SV_TessFactor; 
float InsideTess[2] : SV_InsideTessFactor; 


}; 


PatchTess ConstantHS(InputPatch<VertexOut，4> patch, uint patchID : 
SV_PrimitiveID) 
{ 
PatchTess pt; 


float3 centerL = 0.25fk(patch[6].PosL + 
patch[1].PosL + 
patch[2].PosL + 
patch[3].PosL); 
float3 centerW = mul(float4(centerL, 1.6f), gWorld).xyz; 


float d = distance(centerW, gEyePosW); 














// 根据 网 格 与 观察 点 的 距离 来 对 面 片 进行 镶嵌 处 理 ， 如 果 d >= d1， 则 镶嵌 份 数 为 96， 若 d 
<= d6， 那 么 镶 
// 嵌 份 数 为 64。[de，d1] 区 间 则 定义 了 执行 镶嵌 操作 的 距离 范围 























const float d6 20.6f; 
const float d1 = 106.0f; 
float tess = 64.6f*saturate( (d1-d)/(d1-d6) ); 




















// 对 面 片 的 各 方面 (边缘 、 内 部 〉 进行 统一 的 镶 和 代 化 处 理 








pt.EdgeTess[6] = tess; 
pt.EdgeTess[1] = tess; 
pt.EdgeTess[2] = tess; 
pt.EdgeTess[3] = tess; 


pt.InsideTess[6] = tess; 
pt.InsideTess[1] = tess; 


return pt; 


} 


struct HullOut 
{ 

float3 PosL : POSITION; 
}; 


[domain("quad")] 
[partitioning("integer")] 
[outputtopology("triangle cw")] 
[outputcontrolpoints(4)] 
[patchconstantfunc("ConstantHS")] 
[maxtessfactor(64.6f)] 

HullOut HS(CInputPatch<VertexOut，4> p， 


uint i : SV_OutputControlPointID， 
uint patchId : SV_PrimitiveID) 


{ 
HullOut hout; 


hout.PosL = p[i].Post; 
return hout; 


} 





仅 是 简单 地 镶 庶 化 处 理 还 不 足以 为 网 格 增添 丰富 的 细节 ， 因 为 新 增 
的 三 角形 仅仅 是 列 于 经 过 细 分 的 面 片 〈 平 面 ) 之 上 。 因 此 ， 我 们 一 定 要 
以 茶 种 方式 来 移动 这 些 新 增 的 顶点 ， 使 目标 物体 的 形状 更 接近 于 预定 的 
模型 。 而 这 些 操作 都 是 在 域 着 色 器 中 执行 的 。 在 这 个 演示 程序 中 ， 我 们 
以 7.7.3 节 中 介绍 过 的 “ 山 丘 ?模拟 函数 在 y 轴 方向 上 对 诸 顶 点 进行 侦 移 。 








struct DomainOut 


{ 
float4 PosH : SV_POSITION; 


}; 


// 每 当 镶 肉 器 创建 项 点 时 都 要 调用 域 着 色 器 
// 可 以 将 它 看 作 镶 远 环 节 后 的 “顶点 着 色 器 ” 
[domain("quad")] 
DomainOut DS(PatchTess patchTess， 
float2 uv : SV _ DomainLocation, 
const OutputPpatch<HullOut, 4> quad) 
































DomainOut dout; 


// 双 线 性 插值 











float3 v1 = lerp(quad[8].PosL, quad[1].PosL, uv.x); 
float3 v2 = lerp(quad[2].PosL, quad[3] .PosL, uv.x); 
float3 p = lerp(v1i, v2, uv.y); 


// 位 移 贴 图 (displacement mapping) 
p.y = 8.3f*( p.z*sin(p.x) + p.x*cos(p.z) ); 


float4 posW = mul(float4(p, 1.6f), gWorld); 
dout.PosH = mul(posW, gViewProj); 


return dout; 


float4 PS(DomainOut pin) : SV_Target 


{ 
return float4(1.6f, 1.6f, 1.6f, 1.6f); 


} 





14.6 三 次 见 窗 尔 四 边 形 面 片 


在 本 节 中 ， 我 们 将 描述 三 次 贝 塞 尔 四 边 形 面 片 (cubic Bézier quad 
patch) ， 并 展示 如 何以 更 多 的 控制 点 来 构建 曲面 。 在 讲解 曲面 之 前 ， 我 
们 先 来 一 睹 贝 塞 尔 曲 线 (Beézier curve) 的 “风采 ”。 





14.6.1 贝 守 尔 曲 线 


现 考虑 我 们 有 3 个 非 共 线 的 控制 点 Pp、P1 与 P2。 0 
个 控制 点 来 定义 一 条 贝 窗 尔 曲 线 。 为 求 得 曲线 上 的 一 点 PWW， 首 先 要 用 t 
在 点 Po 与 把 Pl 之 间 以 及 点 P1 与 点 P2 之 间 共 进行 两 次 线性 插值 ， 以 此 来 分 
别 获取 其 间 的 两 个 中 间 操 : 


pi = (1 — t)po + tpi 
一 (1 一 t)p] + tp 


接着 ， 利 用 t 在 中 间 点 P6 与 Pl 之 间 再 次 进行 线性 插值 来 求 出 曲线 上 一 
点 P(t); 


p(t) = (1— tp + tpi 
= (1—t((l— tpo+tp) +t((l -tpi +tp,) 
= (1po+2(1 ttp 4 ipa 





换 句 话说 ， 二 次 (二 阶 ) 贝 塞 尔 曲 线 的 参数 方程 是 通过 连续 插值 而 
推导 出 来 的 : 


p(t) 一 (1 一 站 2 + 2(1 一 妇 tp1 十 tp» 


同 理 ，4 个 控制 点 Po、Pl1、P2 以 及 Ps 则 定义 了 3 次 (三 阶 ) 贝 塞 尔 曲 
线 ， 曲 线 上 的 点 PW 同样 可 采用 重复 插值 法 求 得 。 图 14.6 就 演示 了 3 次 贝 
塞 尔 曲 线 的 连续 插值 过 程 。 前 先 ， 在 4 个 给 定 控制 点 所 定义 的 每 条 线段 
上 进行 第 一 次 线性 插值 ， 求 出 第 一 波 生成 的 三 个 中 间 点 : 





(a) 











图 14.6 ”为 求 出 三 次 贝 塞 尔 曲线 上 的 点 而 进行 重复 插值 运算 〈 设 插值 因子 为 上 二 0.5) 
(a) 4 个 控制 点 以 及 它们 所 定义 的 三 次 贝 塞 尔 曲线 
(b) 在 控制 点 之 间 进 行 线性 插值 来 计算 第 一 批 中 间 点 
(c) 在 第 一 波 中 间 点 之 间 进 行 线性 插值 来 生成 第 二 批 中 间 点 
(d) 在 第 二 批 中 间 点 之 间 再 次 进行 线性 插值 以 求 出 三 次 贝 塞 尔 曲线 上 的 点 





















































接 下 来 ， 在 第 一 批 生成 的 中 间 点 所 连接 的 线段 上 进行 线性 插值 ， 求 
取 第 二 批 生成 的 中 间 点 : 
po = (1 — t)po + tp1 
三 旭 一 t)* po + 2{(1— t)tp! + tp 


pi = (1 — t)pi + tp2 
= 


最 后 ， 对 第 二 批 中 间 点 进行 线性 插值 以 求 出 三 次 贝 赛 尔 曲线 上 的 点 


p(t). 


p(t) = (1 —t)pi + tp? 
=(1—t)((1— tpo+2(1— ttpi + tp2) +t((1—t) pi + 2(1— ttps + tpa) 


将 它 化 简 为 三 次 (三 阶 ) 贝 塞 尔 曲线 的 参数 方程 : 
p(t) = (1 —t} po + 3t(1 一 性 和 二 322(1 — t)p, + tp (14.1) 
通常 来 讲 ， 三 次 贝 塞 尔 曲 线 就 能 够 满足 一 般 用 户 的 需求 了 ， 因 为 它 


足够 平滑 ， 而 且 对 曲线 控制 的 目 由 度 也 比较 高 。 当 然 ， 我 们 也 可 以 继续 
以 同样 的 递归 方式 进行 重复 插值 ， 以 获取 更 高 阶 的 曲线 。 





事实 证 明 ，7m 阶 贝 塞 尔 曲 线 公 式 可 以 用 伯 扰 斯坦 基 函 数 (Bernstein 
basis function) 的 形式 来 表示 ， 其 定义 为 : 


nl! | i 
Bt) = t(l1—t) 


He il(n Co— 2)! 








对 于 三 阶 曲 线 而 言 ， 它 所 对 应 的 伯 恩 斯 坦 基 函数 分 别 为 : 











Bt) =— (lt =(1-t) 
olt) O13 — 0) ( ) | ) 
3! a ) 
B3(+) ti(1—1t) 3t(1 — tt) 
1 1!(3—1) 
B3(t) i 1 一 32(1 一 性 
2(t) = (3 2) l , 一 
31 站 
B3(t) 本 








将 这 些 结果 与 式 (14.1) 中 的 因子 进行 比 对 ， 我 们 就 能 把 三 次 贝 紧 
和 尔 曲线 方程 写作 : 


3 
p(t) = 2 Bj(t)p; = Bolt)po + Bi(t)pi + B2(t)ps + B3(t)ps 
7=0 


我 们 可 以 运用 导数 的 乘 方 与 乘积 运算 法 则 来 求 出 三 次 伯 恩 斯 坦 基 函 
数 的 导数 : 


BY(t) = —3(1 —t) 





BY(t) = 3(1 ~—t) — 6t(1—t) 
B3>'(t) = 6t(1 —t) — 32 


BY(t) = 3 


因此 ， 对 3 次 贝 塞 尔 曲线 求 导 的 结果 为 : 


3 
p(t) = >》 BY (t)p; = Bo (po + BY (tp + BY (tpa + BY(t)p3 
7=0 


通过 这 些 导数 便 可 以 很 方便 地 计算 出 曲线 上 某 点 处 的 切 问 量 。 


注 过 Note > 


网 络 上 有 演示 贝 塞 尔 曲线 的 相关 小 应 用 程序 (applet) 。 我 们 可 以 
对 它 进行 设置 或 直接 操纵 其 控制 点 ， 以 此 来 观察 这 些 因 系 与 曲线 形状 的 
关联 。 





党 图 14.7 展 开 。 考 虑 一 个 具有 4 x 4 控制 点 的 面 
1 塞 尔 曲 





本 节 将 自始至终 围 
片 。 其 每 一 行 都 含有 4 个 控制 点 ， 因 此 就 可 以 定义 出 4 条 三 次 贝 


线 。 第 i 行 的 贝 窄 尔 曲线 可 表示 为 : 


qo(u) 














图 14.7 构建 一 个 贝 塞 尔 曲面 。 此 处 进行 了 些 合理 的 简化 ， 使 读者 对 该 图 示 更 容易 理解 一 一 实 

际 上 ， 控 制 点 通常 并 非 都 位 于 同一 平面 内 ， 而 所 有 Giltz) 的 位 置 也 未 必 都 如 图 中 那样 的 理想 〈 仅 

当 曲 线 相同 且 每 条 曲线 上 的 控制 点 位 置 都 相同 时 才 会 出 现 图 中 的 情况 ) ， 而 且 ，P( ,往往 不 会 
昌 线 


















































是 条 直线 ， 而 是 一 条 贝 塞 尔 














3 ww 处 进行 求 值 ， 便 会 获得 4 个 点 所 
一 条 曲线 。 由 此 ， 我 们 就 能 通过 这 4 个 点 来 


构成 的 “ 列 *”， 它 必 将 经 过 
定义 另外 一 本 曲面 (Bkzier surface) 上 wo 处 的 贝 塞 尔 曲线 : 





plv) -> B; (v)gq; (uo) 


=0 
a 变量 ， 便 可 使 整 条 三 次 贝 塞 尔 曲 线 移动 
而 “ 扫 ” 出 一 个 三 次 贝 塞 尔 曲面 (cubic Bézier surface) : 


3 
plu,1) = >》 Bi(v)gi(u) 


i=0 


3 3 
= 》 Bi(v) 》 Bi(wp:; 


t=0 7=0 








贝 具 尔 曲面 的 仿 导 数 有 助 于 计算 出 对 应 曲面 处 的 切 向 量 与 法 向 量 : 





Op 8B3, 到 
多 0) -> 交 (vu) 2 Bl)ps; 


14.6.3 计算 三 次 贝 于 尔 曲面 的 相关 代码 


在 本 节 中 ， 我 们 会 给 出 用 于 计算 三 次 贝 塞 尔 曲 面 的 相关 代码 。 为 了 
便于 读者 理解 这 些 代 码 ， 我 们 将 实现 的 求 和 表达 式 展 开 如 下 : 
qo(u) = Bo(u)poo + Bi(u)poi + By(u)pos + B3(u)pos 
qi(u) = Bi(wpio + BI(upii + BI(u)pis + B3(u)p1s 
qs(u) = Bo(u)p2o + Bilu)po1 + BY(u)po2 + B3(u)p, 3 


qal u) = Bi( U)PD30 十 BI( u)ps 1 十 B32( u)P3 2 十 Bt UPD3 3 


\ sa a :re :ya 3 
plu,v) = Bilv)go(lu) + Bilv)qi(u) + Bi(v)go(u) + B3(v) galu) 
= Bo(v) [Bo(w)poo + Bi(wpor + B2(u)po2 + B3(u)poa] 
+ BY(v) [Bi(wpio + BI(upii + BI(u)p12 + B3(u)p13| 


eS 


37 、 dr 2 BA pA 
+ B3(v) | Bt uU)Po0 十 BY (wu)pPo 1 十 B3 | U)Poo 十 Ba u)pPo 3 


| 


PR 、 :pe Bf 3/ 、 
+ B3(v) [Bo(w)pao + Bi(u)p31 + B2(u)p32 + B3(u)p33 








以 下 代码 就 是 由 上 述 方程 直接 改写 而 得 到 的 : 





float4 BernsteinBasis(float 七 ) 


{ 
float invT = 1.6f - 七 ; 


return float4( invT * invT * invT, // Bd)=11= 
3.6f * t * invT * invT， yy 
3.6f * t * t * invT， es 
起 汪汪 和 // Bltl=t 
} 
float4 dBernsteinBasis(float t) 
{ 
float invT = 1.6f - 七 ; 
return float4( 
-3 * invT * invT， J/ 本 的 =-341- 邮 
: By t= 3711- -6ti1-t) 
3 * invT * invT - 6 * tt * jnvT, // 
6 六 七 # invT - 3*t* t， // B,' (t=6t1i -0 -3t 
3* 人 七 * 上 ); // SB: t= 3 


} 


float3 CubicBezierSum(const OutputPatch bezpatch， 
float4 basisU, float4 basisV) 
{ 
float3 sum = float3(6.6f, 6.6f, 8.6f); 
sum = basisV.x * (basisU.x*bezpatch[8].PosL + 
basisU.y*bezpatch[1].PosL + 
basisU.z*bezpatch[2].PosL + 
basisU.w*bezpatch[3].PosL ); 


sum += basisV.y * (basisU.x*bezpatch[4].PosL + 


basisU.y*bezpatch[5].PosL + 
basisU.z*bezpatch[6].PosL + 
basisU.w*bezpatch[7].PosL ); 


sum += basisV.z * (basisU.x*bezpatch[8].PosL + 
basisU.y*bezpatch[9].PosL + 
basisU.z*bezpatch[16].PosL + 
basisU.w*bezpatch[11].PosL); 


sum += basisV.w * (basisU.x*bezpatch[12].PosL + 
basisU.y*bezpatch[13].PosL + 
basisU.z*bezpatch[14].PosL + 
basisU.w*bezpatch[15].PosL); 


return sum; 





以 上 函数 可 用 于 求 取 PLu 2 并 计算 其 俩 导数 : 


float4 basisU = BernsteinBasis(uVv.x); 
float4 basisV = BernsteinBasis(uv.y); 


// HN) 
float3 p = CubicBezierSum(bezPatch, basisU, basisV); 


float4 dBasisU = dBernsteinBasis(uVv.x); 
float4 dBasisV = dBernsteinBasis(uv.y); 


float3 dpdu = CubicBezierSum(bezPatch, dbasisU, basisV); 


th 
— (i.v) 


// ™ 


float3 dpdv = CubicBezierSum(bezPatch, basisU, dbasisV); 





注 意 Note i 


可 以 发 现 ， 我 们 把 基 函 数 (basis function) 的 计算 结果 传 入 了 
CubicBezierSum 函 数 。 由 于 Ptw zu) 与 其 偏 导数 的 求 和 形式 相同 ， 仅 基 
函数 不 同 ， 因 此 CubicBezierSum 函 数 不 仅 能 用 来 计算 Ptuw uvw， 还 可 以 
用 于 求 取 其 俩 导数 。 





14.6.4 ”定义 面 片 的 几何 形状 





我 们 的 项 扣 缓 冲 区 存储 看 按 下 列 方式 来 创建 的 16 个 控制 点 : 





void BezierPatchApp::BuildQuadPatchGeometry() 
{ 
std::array<XMFLOAT3,16> vertices = 
{ 一 … 
// 第 6 行 
XMFLOAT3(-16.6f，-16.6f，+15.6f)， 
XMFLOAT3(-5.6f，6.6f，+15.6f)， 
XMFLOAT3(+5.6f，6.6f，+15.6f)， 
XMFLOAT3(+16.6f，6.86f，+15.6f)， 


// 第 1 行 
XMFLOAT3(-15.6f，6.6f，+5.6f)， 
XMFLOAT3(-5.6f，6.6f，+5.6f)， 
XMFLOAT3(+5.6f，26.6f，+5.6f)， 
XMFLOAT3(+15.6f，6.6f，+5.6f)， 


// 第 2 行 

XMFLOAT3(-15.6f，6.6f，-5.6f)， 
XMFLOAT3(-5.6f，6.9f，-5.6f)， 
XMFLOAT3(+5.6f，6.9f，-5.6f)， 
XMFLOAT3(+15.6f，6.6f，-5.6f)， 


// 第 3 行 
XMFLOAT3(-16.6f，16.6f，-15.6f)， 
XMFLOAT3(-5.6f，6.6f，-15.6f)， 
XMFLOAT3(+5.6f，6.6f，-15.6f)， 
XMFLOAT3(+25.6f，16.6f，-15.6f) 


}; 


std::array<std::int16 t, 16> indices = 


{ 
6，1，2，3， 
4, 5，6, 7，, 
8, 9, 160, 11, 
12, 13, 14, 15 
}; 


const UINT vbByteSize = (UINT)vertices.size() * sizeof(Vertex); 
const UINT ibByteSize = (UINT)indices.size() * sizeof(std::uint16 t); 


auto geo = std::make unique<MeshGeometry>(); 
geo->Name = "quadpatchGeo"; 


ThrowIfFailed(D3DCreateBlob(vbByteSize, &geo->VertexBufferCPU)); 
CopyMemory (geo->VertexBufferCPU->GetBufferpointer(), vertices.data(), 
vbByteSize); 


ThrowIfFailed(D3DCreateBlob(ibByteSize, &geo->IndexBufferCPU)); 
CopyMemory (geo->IndexBufferCPU->GetBufferPpointer(), indices.data(), 
ibByteSize); 


geo->VertexBufferGPU = d3dUtil::CreateDefaultBuffer(md3dDevice.Get(), 
mCommandList.Get(), vertices.data(), vbByteSize, geo- 
>VertexBufferUploader); 


geo->IndexBufferGPU = d3dUtil::CreateDefaultBuffer(md3dDevice.Get(), 
mCommandList.Get(), indices.data(), ibByteSize, geo- 
>IndexBufferUploader); 


geo->VertexByteStride = sizeof(XMFLOAT3); 
geo->VertexBufferByteSize = vbByteSize; 
geo->IndexFormat = DXGI FORMAT_ R16_UINT; 
geo->IndexBufferByteSize = ibByteSize; 


SubmeshGeometry quadSubmesh; 
quadSubmesh.IndexCount = (UINT)indices.sizel(); 
quadSubmesh.StartIndexLocation = 0; 
quadSubmesh.BaseVertexLocation = ©; 


geo->DrawArgs["quadpatch"] = quadSubmesh; 


mGeometries[geo->Name] = std::move(geo); 





注 Note i 


» 


这 里 并 没有 严格 地 限定 控制 点 一 定 要 按 等 距 排列 为 均匀 的 栅 格 。 





按 下 列 方式 为 四 边 形 面 片 创建 相应 的 泻 染 项 : 


void BezierpatchApp::BuildRenderItems() 
{ 
auto quadPatchRitem = std::make unique<RenderItem>(); 
quadPatchRitem->World = MathHelper::Identity4x4(); 
quadPatchRitem->TexTransform = MathHelper::Identity4x4(); 
quadPatchRitem->0bjCBIndex = 6; 
quadPatchRitem->Mat = mMaterials["whiteMat"].get(); 
quadPatchRitem->Geo = mGeometries["quadpatchGeo"] .get(); 
quadPatchRitem->PrimitiveType = D3D PRIMITIVE TOPOLOGY 16 CONTROL_ 
POINT_PATCHLIST ; 
quadPatchRitem->IndexCount = quadPatchRitem->Geo- 
>DrawArgs["quadpatch"].IndexCount; 
quadPatchRitem->StartIindexLocation = 
quadPatchRitem->Geo->DrawArgs["quadpatch"].StartIindexLocation; 
quadPatchRitem->BaseVertexLocation = 
quadPatchRitem->Geo->DrawArgs["quadpatch"].BaseVertexLocation,; 
mRitemLayer[(int)RenderLayer::Opaque].push back(quadPatchRitem. get()); 


mAllRitems.push back(std: :move(quadPatchRitem) ) ; 





图 14.8 所 示 即 为 贝 赛 尔 曲面 演示 程序 的 效果 。 








图 14.8” 贝 塞 尔 曲 面 演 示 程 序 的 效果 


记 7: 涉 结 


1. 曲面 细 分 是 演 染 流水 线 中 的 一 个 可 选 阶 段 。 它 由 外 壳 着 色 髓 、 
镶 伐 需 与 域 着 色 器 构成 。 其 中 ， 外 元 着 色 器 与 域 者 色 圳 古 可 编程 的 ， 镶 
供需 则 全 权 交 由 硬件 管理 。 














2.， 便 件 曲 面 细 分 有 助 于 节约 内 存 资源 。 有 了 这 项 技术 ， 我 们 就 能 
仅 存 储 低 模 网 格 ， 并 按照 需求 动态 地 运用 灸 肉 化 处 理 手 段 为 网 格 增添 细 
市 。 男 外 ， 像 动画 与 物理 模拟 所 需 的 计算 工作 ， 都 可 以 在 曲面 细 分 之 前 
的 低 模 网 格 上 以 较 低 频次 开展 。 最 后 要 提 到 的 是 ， 连 续 LOD 算 法 现在 已 
经 完全 可 以 在 GPU 上 实现 ， 这 在 硬件 曲面 细 分 技术 诞生 之 前 是 必须 通过 
CPU 来 实现 的 。 











3. 在 开启 曲面 细 分 功能 ， 并 向 泻 染 流水 线 提交 控制 点 后 ， 前 文中 
那儿 种 新 介绍 的 图 元 类 型 就 该 一 展映 手 了 。Direct3D 12 文 持 具 有 1 一 32 
个 控制 点 的 面 片 ， 它 们 分 别 由 枚 举 类 型 
D3D_PRIMITIVE 1 CONTROL POINT_PATCH... 
D3D_PRIMITIVE_32_CONTROL_POINT_PATCH 来 表示 。 


4. 使 用 曲面 细 分 技术 时 ， 顶 点 着 色 器 就 会 以 控制 点 作为 输入 ， 并 
针对 每 个 控制 点 执行 相应 的 动画 或 物理 模拟 计算 。 外 这 着 色 器 由 御 量 外 
过 着 色 器 与 控制 点 外 过 着 色 器 组 成 。 常 量 外 过 着 色 器 对 每 个 面 片 都 逐一 
进行 计算 ， 并 输出 面 片 所 对 应 的 曲面 细 分 因 了 于 ， 该 因子 会 指导 镶 藤 露 对 
面 片 执行 镶 庶 化 处 理 ， 将 其 划分 为 特定 份 数 。 对 了 ， 除 了 输出 曲面 细 分 








因子 外 ， 常 量 外 壳 着 色 器 还 能 输出 一 些 面 片 的 其 他 可 选 数据 。 控 制 点 外 
党 着 色 占 以 大 量 控 制 点 作为 输入 与 输出 ， 每 当 有 控制 点 输出 时 都 会 调用 
它 一 次 。 一 般 来 讲 ， 控 制 点 外 壳 着 色 器 会 修改 输入 面 上 的 曲面 表示 方 
式 。 例 如 ,车 向 外 之 着 色 器 阶段 输入 具有 3 个 控制 点 的 三 角形 ， 它 便 可 
能 输出 拥有 10 个 控制 点 的 贝 窗 尔 三 角形 面 片 。 














5. 曲面 细 分 阶段 会 在 创建 每 一 个 顶点 时 调用 域 着 色 器 。 尽 管 在 开 
局 曲面 细 分 功能 后 ， 顶 点 着 色 器 充当 着 “处 理 每 一 个 控制 点 的 顶点 着 色 
器 ”， 但 实质 上 外 壳 着 色 器 才 是 “针对 镶 败 化 面 片 顶点 进行 处 理 的 顶点 着 
色 器 ”。 特 别 是， 我 们 在 此 阶段 便 可 以 将 镶嵌 处 理 后 的 面 片 顶 点 投射 到 
齐 次 裁 勇 空间 ， 或 针对 这 些 顶 点 执行 其 他 操作 。 





6. 如 宁 我 们 不 对 菏 物 体 进 行 镶 欧 化 处 理 〈 例 如 曲面 细 分 因子 非 闻 
接近 于 1 的 时 候 )， 就 不 要 在 演 染 此 物体 时 开启 曲面 细 分 阶段 ， 这 会 日 
日 产生 一 定 的 开销 。 避 免 对 “ 占 地 ”小 于 8 像素 的 三 角形 执行 镶 授 化 处 
理 。 尽 量 将 所 有 的 镶嵌 化 物体 一 次 性 绘制 出 来 ， 以 避免 在 一 帧 中 往复 开 
关 曲 面 细 分 功能 。 另 外， 在 外 壳 着 色 器 中 可 使 用 背面 剔除 与 视 锥 体 吻 除 
这 些 优化 手段 ， 以 便 丢弃 用 户 根 本 看 不 到 的 镶 馆 面 片 。 





7. 通过 参数 方程 来 指定 贝 塞 尔 曲 线 与 贝 塞 尔 曲 面 ， 借 此 便 可 以 描 
述 出 相应 的 平滑 曲线 与 曲面 。 此 二 者 的 “形状 ”实则 由 控制 点 来 加 以 操 
纵 。 除 了 能 够 直接 绘制 出 平滑 的 曲面 之 外 ， 贝 故 尔 曲面 还 可 以 用 于 一 些 
流行 的 硬件 曲面 细 分 算法 ， 如 PN 三 角形 方法 与 Catmull-Clark 通 近 型 细 分 
曲面 方法 〈Catmull-Clark approximation) 。 


14.8 ”练习 


1. 重新 编写 “Basic Tessellation”( 基 本 曲面 细 分 ) 演示 程序 ， 但 是 
这 一 次 要 对 三 角形 面 片 而 非 四 边 形 面 片 进行 镶 藤 处 理 。 





2. 根据 正二 十 面体 与 观察 点 的 距离 关系 将 其 镶 舱 细 分 为 一 个 球 
体 。 


3. 修改 “Basic Tessellation” 演 示 程 序 ， 对 平面 四 边 形 进 行 固定 配置 
的 曲面 细 分 处 理 〈fixed tessellation， 如 ， 不 随 观 察 点 与 物体 间 的 距离 修 
改 细 分 参数 ) 。 演 试 不 同 的 边缘 细 分 因子 与 内 部 细 分 因子 ， 直 到 找到 最 
为 理想 的 设置 参数 。 


4. 探索 非 整 型 曲面 细 分 。 即 尝试 在 “Basic Tessellation” 演 示 程 序 中 
使 用 : 


[partitioning("fractional even")] 


[partitioning("fractional odd")] 





5. 为 二 次 贝 塞 尔 曲线 计算 伯 因 斯坦 基 函数 世 (、Bi(tb) 与 B2(0， 再 
分 别 求 出 相应 的 导数 Bt0、Bi (与 了 2 扫 。 最 后 ， 对 二 次 贝 塞 尔 曲面 的 
参数 方程 求 导 。 








6. 尝试 通过 修改 “Beézier Patch”( 贝 塞 尔 面 片 ) 演示 程序 中 的 控制 
点 来 改变 其 中 的 贝 塞 尔 曲面 。 





7. 用 附 有 9 个 控制 点 的 二 次 贝 竖 尔 曲面 重新 实现 “Bkzier Patch” 演 示 


程序 。 


8， 修改 “Bekzier Patch”* 演 示 程 序 ， 利 用 光照 使 其 中 的 贝 窄 尔 曲面 表 
现 出 明暗 变化 。 为 此 ， 我 们 需要 在 域 着 色 器 中 计算 顶点 法 线 。 而 位 于 项 
点 处 的 法 线 可 由 此 曲面 点 处 坐标 的 仿 导数 又 积 求 得 。 





9. 研究 并 实现 贝 墅 尔 三 角形 面 片 。 





[1] 曲面 细 分 或 称 细 分 曲面 是 一 种 可 将 粗糙 几何 体 网 格 细 化 的 技术 ， 瑞 
文 原 为 subdivision surface。 镶 租 (tessellation〉 则 是 可 实现 此 技术 的 具 
体 手段 《如 文中 所 述 亦 可 实现 LOD 等 ) ， 因 此 此 处 将 “ 馈 欣 ” 称 为 “曲面 
细 分 ” 实 为 化 用 。 这 里 为 便于 区 分 整个 “曲面 细 分 阶段 ”与 其 中 的 “ 镶 摧 器 
阶段 ?实现 细节 分 别 采 用 两 种 译 法 ， 请 读者 注意 。 


[2] ”D3D_PRIMITIVE_TOPOLOGY 枚 举 项 描述 的 是 输入 装配 阶段 中 的 顶 
点 类 型 ， 而 D3D_PRIMITIVE 枚 举 项 则 描述 的 是 外 沉着 色 器 的 输入 图 元 类 
型 。 


[3] Direct3D 12 亦 是 如 此 ， 参 见 《Constants》 (dn903792) 中 的 
D3D12_TESSELLATOR_MAX_TESSELLATION_FACTOR 常 量 定义 。 





[4] silhouette edge 的 定义 通 弟 是 外 回 乎 面 法 线 垂直 于 观察 癌 量 的 点 在 投 
影 平 面 内 的 集合 ， 也 就 是 正面 朝 癌 平面 与 背面 间 癌 平面 间 的 交界 线 ， 即 
可 见 物体 的 轮廓 线 。 绪 合 上 下 文 里 的 “ 朝 同 〈orientation) ”一 词 ， 译 者 

认为 作者 这 里 所 说 的 意思 为 正 对 观察 者 的 三 角形 细节 要 丰富 于 侧面 非 正 











对 观察 者 的 那些 三 角形 。 


[5] 用 户 疝 目标 物体 移动 过 程 中 ， 随 距离 变换 会 触发 不 同 LOD 的 曲面 
细 分 ， 硅 取 文 中 的 整数 因子 ， 则 细 分 之 间 物 体 细 市 变化 过 大 ， 容 易 看 出 
物体 的 变化 过 程 。 比 如 明明 是 一 块 校 角 分 明 的 石头 ， 走 了 两 步 也 许 就 变 
成 球体 了 .3600 除了 文中 介绍 的 3 种 partitioning 参 数 之 外 ， 还 有 一 种 
pow2 因 子 ， 即 因子 值 为 2 的 次 方 。 


[6] outputtopology 参 数 还 有 一 个 point 选 项 。 


[7] 此 阶段 (tessellation stage， 有 时 也 写作 tessellator stage) 起 主要 作 
用 的 是 镶嵌 器 。 由 于 现在 是 将 曲面 细 分 阶段 《官方 名 亦 为 tessellation 
stage， 可 见 ， 二 者 的 名 称 容易 冲突 ) 按 顺 序 划 分 为 外 壳 着 色 嚣 〈 由 和 销量 
外 过 着 色 器 与 控制 点 外 壳 着 色 器 组 成 )、 镶 详 器 、 域 着 色 器 三 个 环 市 ， 
所 以 此 市 名 为 “ 镶 摧 器 阶段 ”似乎 更 受 。 











[8] 怀疑 这 是 笔 误 。 因 为 外 沉着 色 器 没有 执行 镶 骨 处 理 ， 这 一 工作 是 由 
馈 藤 器 实现 ， 而 且 还 着 重 说 明 “ 已 经 过 镶 咀 化 的 面 片 (tessellated 

patch) ”， 结 合 域 着 色 器 在 镶 谍 器 之 后 这 一 位 置 关 系 ， 再 阅读 代码 中 实 
际 进行 坐标 变换 的 着 色 器 ， 怀 疑 这 里 所 述 的 应 当 为 域 着 色 咒 。 








第 二 部 分 主题 访 


在 本 部 分 中 ， 我 们 的 重点 是 通过 Direct3D 实 现 几 组 3D 应 用 来 演示 多 
种 相关 技术 ， 例 如 泻 染 天 空 场景 、 环 境 光 遮 责 〈ambient occlusion， 也 
有 译作 环境 光 吸 收 等 ) 、 角 色 动 画 〈character animation) 、 拾 取 
Cpicking) 、 环 境 贴图 (environment mapping， 也 有 译作 环境 映射 ) 、 
法 线 贴图 Cnormal mapping， 也 有 译作 法 线 映 射 ) 以 及 阴影 贴图 
(shadow mapping， 也 有 译作 阴影 映射 ) 。 


第 15 章 “构建 第 一 人 称 视角 的 摄像 机 与 动态 索引 ”本 章 将 展示 怎样 
按 第 一 人 称 的 游戏 视角 来 设计 一 个 摄像 机 系统 。 示 例 中 ， 我 们 会 通过 键 
盘 与 鼠标 的 输入 操作 来 控制 此 摄像 机 。 除 此 之 外 ， 本 章 还 会 介绍 
Direct3D 12 中 新 引进 的 动态 索引 (dynamic indexing) 技术 ， 以 此 对 着 色 
器 中 的 纹理 对 象 数 组 进行 动态 索引 。 


第 16 章 “实例 化 与 视 锥 体 剔 除 ? 实 例 化 〈instancing) 是 一 种 硬件 文 
持 技 术 ， 可 以 针对 同一 几何 图 形 以 不 同 参数 〈 意 即 在 场景 中 的 不 同位 置 
或 具有 不 同 的 颜色 ) 的 绘制 情况 进行 优化 。 视 锥 体 剔 除 也 是 一 种 优化 技 
术 ， 当 整个 物体 都 处 于 虚拟 摄像 机 的 视野 之 外 时 ， 我 们 就 可 利用 此 技术 
将 已 提交 至 演 染 管线 的 对 应 物体 完全 丢弃 。 我 们 还 会 在 此 章 展 示 如 何 计 
算 网 格 的 包围 盒 与 包围 球 。 








第 17 章 “拾取 ”本 章 会 讲述 如 何 来 确定 用 户 通过 鼠标 选取 的 特定 3D 


对 象 〈 或 3D 图 元 ) 。3D 游 戏 与 3D 应 用 中 经 常会 用 到 此 技术 ， 使 用 户 利 
用 鼠标 与 3D 环 境 交 互 。 


第 18 章 “立方 体贴 图 ”本 章 将 演示 如 何 将 环境 贴图 映射 到 任意 形状 的 
网 格 之 上 ， 还 会 通过 环境 图 来 为 天 空 球 〈sky-sphere) 贴图 。 


第 19 章 “法 线 贴图 ”本 章 将 展示 如 何 通 过 使 用 法 线 图 (normal map， 
即 存 有 法 问 量 的 纹理 ) 来 为 实时 光照 效果 增添 更 加 丰富 的 细节 。 由 于 法 
线 图 中 的 表面 法 线 比 逐 顶 点 法 线 (per-vertex normal) 的 粒度 更 细 ， 因 此 
光照 效果 也 更 加 真实 。 











第 20 草 “阴影 贴图 ?阴影 贴图 是 一 种 实时 的 阴影 绘制 技术 ， 借 此 可 以 
将 阴影 演 染 到 任意 形状 的 几何 体 之 上 《 即 不 仅 限 于 平面 阴影 ) 。 本 章 还 
会 介绍 投影 纹理 的 工作 原理 。 











第 21 章 “环境 光 遮 责 ? 在 使 场景 变 得 更 加 真实 的 过 程 中 ， 光 照 扮 沉 兰 
极为 重要 的 角色 。 本 章 会 根据 场景 中 某 点 对 入 射 光 被 周围 物体 遮挡 的 程 
度 来 改 民 光照 方程 中 的 环境 光 项 。 








第 22 章 “四 元 数 ” 本 章 将 介绍 称 为 四 元 数 〈(guaternion) 的 数学 对 象 
(mathematical object〉， 将 展示 用 单位 四 元 数 表示 旋转 ， 并 用 简便 的 方 
法 对 它 进行 插值 ， 以 此 来 简洁 地 实现 插值 以 及 旋转 操作 。 一 旦 可 以 实现 
上 述 操作 ， 我 们 便 可 创建 3D 动 画 。 





第 23 章 “角色 动画 ”本 章 涵 盖 了 角色 动画 理论 ， 并 展示 怎样 通过 一 个 
复杂 的 行走 动画 来 驱动 人 形 游戏 角色 。 








第 15 章 ”构建 第 一 人 称 视角 的 摄像 机 与 动 
态 系 引 


在 本 章 中 ， 我 们 将 分 别 探讨 两 个 略 显 简短 的 主题 。 首 先 ， 我 们 要 设 
计 一 个 如 同 第 一 人 称 游戏 中 那样 的 摄像 机 系统 ， 并 用 它 来 蔡 代 之 前 演示 
程序 中 的 旋转 摄像 机 系统 (orbiting camera system) 。 其 次 ， 我 们 会 介 
绍 Direct3D 12 中 一 种 名 为 动态 索引 (dynamic indexing， 上 自 着 色 器 模型 
5.1 开 始 才 有 的 新 功能 ) 的 新 技术 ， 由 此 便 可 以 对 纹理 对 象 数 组 (如 
Texture2D 8gDiffuseMap[n]) 进行 动态 索引 了 。 这 与 我 们 在 第 12 章 中 
索引 的 特殊 纹理 数组 对 象 (Texture2DArray) 有 些 相 似 ， 但 与 之 不 同 
的 是 ， 动 态 索引 可 以 处 理由 不 同 大 小 与 类 型 的 纹理 所 构成 的 数组 ， 因 此 
比 Texture2DArray 资 源 灵 活 得 多 。 





学 习 目 标 : 


1. 复习 观察 空间 变换 (view space transformation， 也 作 取 景 变 换 ) 
的 相关 数学 知识 。 


2. 能 够 指出 第 一 人 称 摄像 机 具有 代表 性 的 功能 。 
3. 学 习 如 何 来 实现 第 一 人 称 摄像 机 。 


4. 理解 怎样 对 纹理 数组 进行 动态 索引 。 


15.1 重 温 取景 变换 








如 图 15.1 所 示 ， 观 察 空 间 (view space， 也 有 译作 观察 坐标 系 、 视 图 
空间 等 ) 是 附属 于 摄像 机 的 坐标 系 。 此 空间 中 ， 摄 像 机 位 于 坐标 系 原 
点 ， 沿 z 轴 正方 向 观察 ，z 轴 指 疝 摄 像 机 右 侧 ，y 轴 指 疝 摄像 机 的 正 上 
方 。 我 们 能 够 用 它 来 取代 场景 中 的 项 点 相对 于 世界 空间 (world space， 
也 有 译作 世界 举 标 系 ) 所 朱 述 的 位 置 关 系 ， 以 便 在 演 染 流水 线 的 后 续 阶 
段 中 以 摄像 机 坐标 系 来 描述 这 些 顶 点 。 从 世界 空间 至 观察 空间 的 坐标 变 
换 称 为 取景 变换 (view transform， 也 作 观 察 变 换 等 ) ， 对 应 的 矩阵 则 称 


作 观 察 矩 阵 (view matrix) 。 























图 15.1 ”摄像 机 坐标 系 。 摄 像 机 在 自己 专属 的 坐标 系 中 ， 位 于 坐标 系 原 点 并 沿 z 轴 正方 向 观察 














如 果 @w = (Qz, Wy, @:, l} uw = (Ur, Uy, Us, 0)、 
vw = (Vr, Vy, VU:, 0) ww = (Wr, Wy, W:, 0) 分 别 表示 观察 空 x 间 中 的 原点 、 
z 轴 、y 轴 与 : 轴 相 对 于 世界 空间 的 齐 次 坐标 ， 则 根据 3.4.3 节 可 知 ， 从 观 


察 空 间 人 至 世界 空间 的 坐标 变换 窍 阵 为 : 








然而 ， 这 却 并 不 是 我 们 所 期 待 的 变换 。 刚 好 相反 ， 我 们 需要 的 是 由 
世界 空间 到 观察 空间 的 变换 。 再 次 回顾 3.4.5 节 可 知 ， 这 种 逆 变 换 通 
述 窟 阵 的 首 即 可 实现 ， 因 此 可 利用 几 一 ! 将 坐标 从 世界 空 a 
间 。 











一 般 来 讲 ， 世 界 坐 标 系 与 观察 坐标 系 的 差别 仅 在 于 位 置 与 朝 癌 ， 因 
此 可 直观 地 记 作 W = RT 即将 世界 矩阵 分 解 为 一 个 旋转 沧 阵 与 一 个 平 
移 矩 阵 的 乘积 ) 。 这 使 得 敢 变 换 的 计算 更 为 简便 : 





因此 ， 观 察 矩 阵 形 如 : 


Ws Ue Wr 人 
Uy Uy wy 0 
U. U. WwW. U 


Sy (15 


同 所 有 的 坐标 变换 一 样 ， 我 们 并 没有 移动 场景 中 的 任何 物体 。 由 于 
我 们 用 摄像 机 空间 的 参考 标 架 (frame of reference) 取代 了 世界 空间 的 
参考 标 架 ， 以 致 场景 中 物体 的 坐标 才 纷 纷 发 生 了 改变 。 


15.2 ”摄像 机 类 


为 了 封装 摄像 机 部 分 的 相关 代码 ， 我 们 就 要 定义 并 实现 Camera 

类 。 该 摄像 机 类 中 的 数据 存储 了 两 种 关键 信息 。 第 一 种 为 此 类 中 定义 的 
position、Tight、up 与 look 向 量 ， 分别 是 以 世界 空间 化 标 表 示 的 观察 空间 
坐标 系 的 原点 、z 轴 、y 轴 、: 轴 。 第 二 种 为 视 锥 体 的 属性 。 我 们 可 以 把 
摄像 机 的 镜头 (lens of camera) 当 作 视 锥 体 的 定义 《 即 视 锥 体 的 视 场 角 
以 及 近 平 面 、 远 平面 ) 。 该 类 中 实现 的 大 都 是 功能 琐碎 (trivial， 如 简 
单 的 存 取 方 法 ) 的 方法 ， 其 中 数据 成 员 和 方法 的 概述 可 参见 以 下 代码 中 
的 注释 。 在 15.3 节 中 ， 我 们 会 对 摄像 机 类 中 的 关键 方法 进行 讲解 。 























class Camera 


{ 
public: 


Camera() ; 
~Camera( ) ; 





// 获取 及 设置 世界 (空间 中 ) 摄 像 机 的 位 置 
DirectX: :XMVECTOR GetPosition()const 
DirectX: :XMFLOAT3 GetPosition3f()const; 

void SetPosition(float x, float y, float 2z); 
void SetPosition(const DirectX: :XMFLOAT3& v); 








// 获取 摄像 机 的 基 向 量 
DirectX: :XMVECTOR GetRight()const; 
DirectX: :XMFLOAT3 GetRight3f()const; 
DirectX: :XMVECTOR GetUp()const; 
DirectX: :XMFLOAT3 GetUp3f()const ; 
DirectX: :XMVECTOR GetLook()const ; 
DirectX: :XMFLOAT3 GetLook3f()const ; 











// 获取 视 锥 体 的 属性 
float GetNearZ()const ; 
float GetFarZ()const ; 
float GetAspect()const; 


float GetFovY()const ; 
float GetFovX()const ; 























// 获取 用 观察 空间 坐标 表示 的 近 、 远 平面 的 大 小 
float GetNearWindowWidth()const; 

float GetNearWindowHeight()const; 

float GetFarWindowWidth()const; 

float GetFarWindowHeight()const; 














// 设置 视 锥 体 
void SetLens(float fovY, float aspect, float zn, float zf); 























// 通过 LookAt 方 法 的 参数 来 定义 摄像 机 空间 

void LookAt(DirectX: :FXMVECTOR pos， 
DirectX::FXMVECTOR target, 
DirectX::FXMVECTOR worldUp); 

void LookAt(const DirectX: :XMFLOAT3& pos， 
const DirectX: :XMFLOAT3& target, 
const DirectX: :XMFLOAT3& up) 


// 获取 观察 矩阵 与 投影 矩阵 
DirectX: :XMMATRIX GetView()const ; 
DirectX: :XMMATRIX GetProj()const ; 


DirectX: :XMFLOAT4X4 GetView4x4f()const 
DirectX: :XMFLOAT4X4 GetProj4x4f()const 





// 将 摄像 机 按 距 离 d 进 行 左右 平移 (strafe) 或 前 后 移动 Walk) 
void Strafe(float d); 
void Walk(float d); 

















// 将 摄像 机 进行 旋转 
void Pitch(float angle); 
void RotateY(float angle); 











// 修改 摄像 机 的 位 置 与 朝向 之 后 ， 调 用 此 函数 来 重新 构建 观察 矩阵 
void UpdateViewMatrix(); 








private: 














// 摄像 机 坐标 系 相对 于 世界 空间 的 坐标 

DirectX: :XMFLOAT3 mpPosition = { 8.6f, 6.6f, 0.6f }; 
DirectX: :XMFLOAT3 mRight = { 1.6f, 8.6f, 68.6f }; 
DirectX: :XMFLOAT3 mUp = { 8.6f, 1.6f, 60.6f }; 
DirectX: :XMFLOAT3 mLook = { 8.6f, 6.6f, 1.6f }; 





© © 


// 绥 存 视 锥 体 的 属性 








float mNearZ = 0.6f; 
float mFarZ = 0.0f; 
float mAspect = 8.6f; 
float mFovY = 0.0f; 


float mNearWindowHeight = 6.6f; 
float mFarWindowHeight = 6.6f; 


bool mViewDirty = true; 


// 绥 存 观察 算 阵 与 投影 第 阵 
DirectX: :XMFLOAT4X4 mView 
DirectX: :XMFLOAT4X4 mProj 


MathHelper: :Identity4x4(); 
MathHelper: :Identity4x4(); 





Camera.h/Camera.cpp 文 件 都 位 于 Common 文 件 夹 中 。 


15.3 ”摄像 机 类 中 的 方法 实现 选 讲 
本 节 内 容 不 涉及 摄像 机 类 中 的 get/set 简 单 存 取 方法 ， 而 是 仅 讨论 其 
中 比较 重要 的 方法 。 


15.3.1 返回 XMVECTOR 类 型 变量 的 方法 


首先 要 谈 及 的 是 摄像 机 类 中 各 “get”* 方 法 返回 XMVECTOR 类 型 变量 的 
问题 。 这 样 做 其 实 只 是 为 了 使 用 方便 而 已 ， 如 此 一 来 ， 若 用 户 需 要 获取 
XMVECTOR 类 型 的 数据 之 时 ， 则 无 需 在 代码 自行 转换 : 





XMVECTOR Camera: :GetPosition()const 


return XMLoadFloat3(&mPosition); 


XMFLOAT3 Camera: :GetPosition3f()const 


return mPosition; 


} 





15.3.2 ”SetLens 方 法 





我 们 可 以 认为 摄像 机 的 镜头 即 视 锥 体 ， 因 为 它 控 制 着 观察 者 的 视 
野 。 所 以 ， 我 们 在 缓存 视 锥 体 属 性 以 及 构建 投影 矩阵 时 就 要 用 到 的 
SetLens 方 法 : 


void Camera: :SetLens(float fovY, float aspect, float zn, float zf) 
{ 


E> 


// 绥 存 视 锥 体 属 ' 
mFovY = fovY; 
mAspect = aspect,; 
mNearZ = zn; 
mFarz = zf; 





mNearWindowHeight = 2.6f * mNearZ * tanf( 06.5f*mFovY ); 
mFarWindowHeight = 2.6f * mFarZ * tanf( 06.5fxmFovY ); 


XMMATRIX P = XMMatrixPerspectiveFovLH(mFovY, mAspect, mNearZz, mFarz); 
XMStoreFloat4x4(&mProj, P); 





15.3.3 ”推导 视 锥 体 信息 


正如 刚刚 所 看 到 的 头 文件 定义 ， 我 们 不 仅 缓 存 了 垂直 视 场 角 ， 还 提 
供 了 额外 的 方法 以 推导 视 锥 体 的 水 平视 场 角 。 除 此 之 外 ， 我 们 还 给 出 了 
特定 方法 返回 近乎 面 与 远 平 面 处 视 锥 体 的 宽度 与 高 度 ， 在 我 们 需要 这 
ee 自然 就 会 知道 其 妙 处 了 。 这 些 方法 的 实现 完全 依赖 于 三 角 
， 如 果 对 下 列 公 式 有 疑问 ， 读 者 可 回顾 5.6.3 市 。 











float Camera::GetFovX()const 


float halfWidth = 6.5f*GetNearWindowWidth(); 
return 2.6f*atan(halfWidth / mNearZ) ; 


} 


float Camera: :GetNearWindowWidth()const 
{ 


return mAspect * mNearWindowHeight; 


} 


float Camera: :GetNearWindowHeight()const 
{ 


return mNearWindowHeight; 


} 


float Camera::GetFarWindowWidth()const 
{ 


return mAspect * mFarWindowHeight; 


} 


float Camera::GetFarWindowHeight()const 
{ 
return mFarWindowHeight; 


} 





15.3.4 与 摄像 机 相关 的 变换 操作 


对 于 第 一 人 称 摄 像 机 来 讲 ， 知 忽略 其 人 硅 撞 检测 (collision 
detection ) 功能 ， 我 们 还 需要 能 够 做 到 : 








1. 使 摄像 机 沿 独 观 罕 〈look) 回 量 前 后 移动 。 这 可 以 通过 令 摄 像 
机 的 位 置 治 其 观察 癌 量 进行 平移 来 实现 。 





2. 令 摄 像 机 沿 着 它 的 右 〈right) 回 量 左右 平移 〈strafe) 。 这 可 以 
通过 使 摄像 机 的 位 置 沿 其 右 同 量 进行 平移 来 实现 。 








3. 使 摄像 机 以 右 疝 量 为 轴 ， 绕 其 旋转 来 进行 信仰 观察。 这 可 以 通 
过 使 用 XMMatrixRotationAxis 函 数 ， 令 摄像 机 的 观察 癌 量 与 上 (up) 
可 量 绕 其 右 问 量 进行 旋转 来 实现 。 

4. 令 摄 像 机 绕 着 世界 空间 的 y 轴 (假设 y 轴 对 应 于 世界 空间 的 “ 问 
上 ” 方 同 ) 同 量 旋转 来 观察 左右 两 人 出 。 这 可 以 通过 使 
用 XMMatrixRotationY 疯 数 ， 令 所 有 的 基 同 量 (basis vector) 绕 世 界 空 
间 的 y 轴 进行 旋转 来 实现 。 


void Camera: :Walk(float d) 
{ 





// mpPosition += d*mLook 

XMVECTOR s = XMVectorReplicate(d); 

XMVECTOR 1 = XMLoadFloat3(&mLook); 

XMVECTOR p = XMLoadFloat3(&mPposition); 
XMStoreFloat3(&mposition, XMVectorMultiplyAdd(s, 1, p)); 


void Camera: :Strafe(float d) 
{ 
// mpPosition += d*mRight 
XMVECTOR s = XMVectorReplicate(d); 
XMVECTOR r = XMLoadFloat3(&mRight); 
XMVECTOR p = XMLoadFloat3(&mPposition); 
XMStoreFloat3(&mPposition, XMVectorMultiplyAdd(s, r, p)); 


} 


void Camera::Pitch(float angle) 
































// 以 右 向 量 为 轴 旋 转 上 疝 量 与 观察 向 量 
XMMATRIX R = XMMatrixRotationAxis(XMLoadFloat3(&mRight), angle); 


XMStoreFloat3(&mUp, XMVector3TransformNormal(XMLoadFloat3(&mUp), R)); 
XMStoreFloat3(&mLook, XMVector3TransformNormal(XMLoadFloat3(&mLook), R)) 


了 


} 


void Camera: :RotateY(float angle) 














{ 
// 绕 世 界 空间 的 y 轴 旋转 所 有 的 基 同 量 
XMMATRIX R = XMMatrixRotationY(angle); 








XMStoreFloat3(&mRight, XMVector3TransformNormal(XMLoadFloat3(&mRight), 
R)); 

XMStoreFloat3(&mUp, XMVector3TransformNormal(XMLoadFloat3(&mUp), R)); 

XMStoreFloat3(&mLook, XMVector3TransformNormal(XMLoadFloat3(&mLook), R)) 





15.3.5 ”构建 观察 矩阵 


UpdateViewMatrix 方 法 首先 将 摄像 机 的 右 同 量 (right) 、 上 回 量 
(up) 与 观察 同 量 (look) 分 别 重 新 进行 正 交 规范 化 


Creorthonormalize， 也 有 译作 规范 正 交 化 等 ) 处 理 。 以 此 确保 它们 彼此 
正 交 ， 且 都 为 单位 长 度 。 这 样 做 很 有 必要 ， 因 为 一 连 串 的 旋转 操作 以 及 
累积 的 数值 误差 会 使 它们 变 为 非 正 交 规范 向 量 。 大 果真 如 此 ， 那 么 这 3 
个 问 量 表示 的 将 不 再 是 直角 坐标 系 ， 而 是 一 个 斜 坐标 系 (skewed 
coordinate System， 也 有 译作 非 对 称 坐 标 系 ) ， 这 并 非 我 们 的 本 意 。 访 
方法 的 后 续 部 分 就 是 将 这 3 个 摄像 机 疝 量 代入 式 (15.1〉 中 ， 从 而 计算 
出 观察 变换 矩阵 。 








void Camera: :UpdateViewMatrix() 


{ 
if(mViewDirty) 
{ 
XMVECTOR R = XMLoadFloat3(&mRight); 
XMVECTOR U = XMLoadFloat3(&mUp); 
XMVECTOR L = XMLoadFloat3(&mLook); 
XMVECTOR P = XMLoadFloat3(&mPosition); 





// 使 摄像 机 的 坐标 向 量 彼 此 正 交 且 保 持 单位 长 度 
L = XMVector3Normalize(L); 
U = XMVector3Normalize(XMVector3Cross(L, R)); 





















































// U，L 已 互 为 正 交 规范 化 向 量 ， 所 以 不 需要 对 下 列 义 积 再 进行 规范 化 处 理 
R = XMVector3Cross(U, L); 











// 填写 观察 矩阵 中 的 元 素 





float x = -XMVectorGetX(XMVector3Dot(P, R)); 
float y = -XMVectorGetX(XMVector3Dot(P, U)); 
float z = -XMVectorGetX(XMVector3Dot(P, L)); 


XMStoreFloat3(&mRight, R); 
XMStoreFloat3(&mUp, U); 
XMStoreFloat3(&mLook, L); 


mView(8, 60) = mRight.x; 
mView(1, 0) = mRight.y:; 
mView(2, 0) = mRight.z; 
mView(3，6) = x; 
mView(8@, 1) = mUp.x; 


mView(1, 1) = mUp.y; 


mView(2，1) 
mView(3, 1) 


mView(@, 2) 
mView(1, 2) 
mView(2，2) 
mView(3, 2) 


mView(86，3) 
mView(1, 3) 
mView(2，3) 
mView(3, 3) 


mUp.z; 
y; 


mLook .x; 
mLook.y; 
mLook.z; 
Z; 


mViewDirty = false; 





A 


15.4 摄像 机 演示 程序 的 知 干 注解 





现在 ， 我 们 就 能 从 应 用 程序 类 《如 本 章 即 
为 CameraAndDynamicIndexingApp 类 ) 中 移 除 如 


mpPhi、mTheta、mRadius、mview 与 npproj 这 些 与 旋转 摄像 机 系统 相关 
的 旧 变 量 。 另 外 ， 还 需 添 加 一 个 成 员 变量 : 


Camera mCamera 


当 调 整 窗口 大 小 时 ， 我 们 就 不 必 杀 自重 新 构建 透视 投影 算 阵 了 ， 只 
需 将 此 任务 委派 给 Camera 类 中 的 SetLens 方 法 即 可 : 





void CameraAndDynamicIndexingApp::OnResize() 


{ 
D3DApp: :OnResize(); 


mCamera.SetLens(6.25f*MathHelper::Pi, AspectRatio(), 1.6f, 16606.6ef); 
} 





可 以 在 OnKeyboardInput 方 法 中 处 理 键盘 的 输入 ， 以 此 来 移动 摄 
像 机 : 





void CameraAndDynamicIndexingApp::OnkeyboardInput(constGameTime&gt) 
{ 
const float dt= gt.DeltaTime(); 


if(GetAsyncKeyState('W') & 6x8660 ) 
mCamera.Walk(16.6f*dt); 


if(GetAsyncKeyState('S') & 6x8660 ) 
mCamera.Walk(-106.6f*dt); 


if(GetAsyncKeyState('A') & 6x806080) 
mCamera.Strafe(-106.6f*dt); 


if(GetAsyncKeyState('D') & 6x8660 1) 
mCamera.Strafe(106.6f*dt); 
mCamera.UpdateViewMatrix(); 


} 





而 在 OnMouseMove 方 法 中 ， 我 们 以 旋转 摄像 机 的 方式 来 调整 其 观察 
方 问 : 


void CameraAndDynamicIndexingApp::OnMouseMove(WPARAM btnState, int x, int 


y) 
{ 
if( (btnState & MK_LBUTTON) != 6 ) 
{ 
// 根据 鼠标 的 移动 距离 计算 旋转 角度 ， 并 使 每 个 像素 都 按 此 角度 的 1/4 进 行 旋转 
float dx = XMConvertToRadians( 
0.25f*static cast(x - mLastMousePos.x)); 
float dy = XMConvertToRadians( 
80.25f*static cast(y - mLastMousePos.y)); 

















mCamera.Pitch(dy); 
mCamera.RotateY(dx); 


} 


mLastMousePos.x 
mLastMousePos.y 


} 


mCamera.UpdateViewMatrix(); 


XMMATRIX view = mCamera.GetView(); 
XMMATRIX proj = mCamera.GetProj(); 





图 15.2 所 示 为 摄像 机 例 程 的 示意 图 。 





提 ] Camera Demo FPS:1055 Frame Time: 0.947867 (ms) ie) 




















图 15.2 ”摄像 机 例 程 的 效果 图 。 通 过 “W”*S”A”“D”4 个 键 来 分 别 控制 摄像 机 
前 、 后 、 左 、 右 4 个 方向 的 平移 。 按 住 鼠 标 左 键 并 移动 鼠标 来 “观察 "不同 的 方向 





15.5 ”动态 索引 


动态 索引 的 概念 比较 简单 ， 即 在 着 色 需 程序 中 对 资源 数组 进行 动态 
地 索引 。 在 本 章 的 滇 示 程序 中 ， 所 用 的 资源 是 纹理 数组 。 指 定 索 引 的 方 
法 各 式 各 样 : 





1. 索引 可 以 是 常量 绥 冲 区 中 的 菏 个 元 素 。 


2. 索引 可 以 是 如 
SV_PrimitiveID、 SV_VertexID、SV_DispatchThreadID 
或 SV_InstanceID 等 类 似 的 系统 ID。 


3. 索引 可 以 通过 计算 求 取 。 


4. 索引 可 来 目 于 纹理 所 存 的 数据 。 





5. 索引 也 可 以 出 目 顶 点 结构 体 中 的 分 量 。 





下 列 着 色 器 语法 声明 了 一 个 具有 4 个 元 素 的 纹理 数组 ， 并 展示 了 怎 
样 利用 来 目 第 量 绥 冲 区 中 的 索引 来 对 该 纹理 数组 进行 索引 。 





cbuffer cbPerDrawIndex : register(b6) 


int gDiffuseTexIndex; 
}; 


Texture2D gDiffuseMap[4] : register(tQ); 


float4 texValue = gDiffuseMap[gDiffuseTexIndex].Sample( 
gsamLinearWrap, pin.TexC); 








对 于 这 个 演示 程序 来 说 ， 我 们 的 目标 是 把 每 个 泻 染 项 所 需 配 置 的 描 
述 符 数 量 降 到 最 低 。 眼 下 ， 我 们 要 为 每 个 泻 染 项 设置 物体 常量 缓冲 区 、 
材质 常量 缓冲 区 以 及 漫 反 射 纹 理 图 的 SRV〈 着 色 器 资源 视图 ) 。 要 使 描 
述 符 的 数量 降 到 最 少 ， 便 需要 令 根 签名 的 规模 变 得 更 小 ， 这 也 就 意味 着 
每 次 绘制 调用 所 需 的 开销 也 会 随 之 减少 。 此 时 ， 若 把 动态 索引 与 实例 化 
Cinstancing， 下 一 章 的 主题 ) 两 项 技术 搭配 使 用 ， 则 效果 拔 群 。 我 们 所 
用 的 策略 如 下 。 





1. 创建 一 个 存 有 所 有 材质 数据 的 结构 化 缓冲 区 。 即 以 结构 化 缓冲 
区 代替 常量 缓冲 区 来 存储 其 材质 数据 。 我 们 可 以 在 着 色 器 程序 中 对 结构 
化 缓冲 区 进行 索引 。 在 绘制 每 一 帧 画面 时 ， 都 将 该 结构 化 缓冲 区 与 洽 染 
流水 线 绑 定 一 次 ， 以 令 所 有 的 材质 都 能 被 着 色 需 程序 所 用 。 





2. 通过 为 物体 常量 缓冲 区 添加 MaterialIndex 字 上 段 来 指定 本 次 绘 
制 调 用 所 用 的 材质 索引 。 在 着 色 器 程序 中 ， 我 们 利用 此 字段 
(gMaterialIndex) 来 索引 材质 结构 化 缓冲 区 。 


3. 在 绘制 每 一 帧 画面 时 ， 直 接 将 场景 中 用 到 的 全 部 纹理 SRV 描 述 
符 ( 以 描述 符 表 的 形式 ) 与 泻 染 流水 线 一 次 性 绑 定 ， 而 不 是 像 之 前 那样 
分 别 绑 定 每 个 深 染 项 的 纹理 SRV。 





4. 向 材质 数据 结构 体 中 添加 DiffuseMapIndex 字 段 ， 以 指定 与 材 
质 所 关联 的 纹理 图 。 据 此 ， 我 们 便 可 对 上 一 步骤 中 与 流水 线 相 绑 定 的 纹 
理 数组 进行 索引 。 


经 过 这 一 系列 配置 ， 我 们 仅 需 为 每 个 演 染 项 都 设置 一 个 物体 利 量 组 


冲 区 。 一 旦 实现 了 这 些 内 容 ， 我 们 就 能 通过 MaterialIndex 字 段 为 绘制 
调用 而 获取 相应 的 材质 ， 并 通过 DiffuseMapIndex 字 段 为 绘制 调用 拾 
取 所 需 的 纹理 。 


注 意 Note 和 


前 文 提 到 ， 结 构 化 缓冲 区 其 实 是 一 种 由 若干 类 型 数据 所 构成 的 数 
组 ， 可 存 于 GPU 端的 显存 之 中 ， 并 通过 着 色 器 程序 访问 。 由 于 我 们 仍 需 
动态 地 更 新 材质 ， 因 此 要 使 用 上 传 缓冲 区 (upload buffer) 而 非 默 认 绥 
冲 区 。 而 且 在 帧 资源 类 中 ， 将 以 材质 结构 化 缓冲 区 取代 之 前 的 材质 常量 
缓冲 区 ， 其 创建 过 程 如 下 : 





struct MaterialData 

{ 
DirectX: :XMFLOAT4 DiffuseAlbedo = { 1.6f, 1.6f, 1.6f, 1.6f }; 
DirectX: :XMFLOAT3 FresnelR6 = { 68.61f, 96.61f, 680.601f }; 
float Roughness = 64.6f; 





// 用 于 纹理 贴图 
DirectX: :XMFLOAT4X4 MatTransform = MathHelper: :Identity4x4() 





UINT DiffuseMapIndex = 6; 
UINT MaterialPado 
UINT MaterialPad1; 
UINT MaterialPad2; 
}; 
MaterialBuffer = std::make unique<UploadBuffer<MaterialData>>( 
device, materialCount, false); 





除 此 之 外 ， 材 质 结构 化 缓冲 区 与 材质 第 量 缓冲 区 两 者 的 代码 差别 不 
Ee 





接 下 来 ， 根 据 着 色 器 所 需 输入 的 新 数据 对 根 签名 进行 更 新 : 


CD3DX12_DESCRIPTOR RANGE texTable; 
texTable.Init(D3D12 DESCRIPTOR_ RANGE TYPE_SRV, 4, 6, 0); 





// 根 参 数 能 够 是 描述 符 表 、 根 捅 述 符 或 根 常 量 
CD3DX12 ROOT_ PARAMETER slotRootPparameter[4]; 
































/ 性 能 小 提示 : 按 变 更 频率 由 高 至 低 排列 
slLotRootParameter[6].InitAsConstantBufferView(6) 
slotRootPparameter[1].InitAsConstantBufferView(1); 
slotRootPparameter[2].InitAsShaderResourceView(6@, 1); 
slotRootParameter[3].InitAsDescriptorTable(1, &texTable, 

D3D12 SHADER VISIBILITY_ PIXEL); 











auto staticSamplers = GetStaticSamplers(); 











// 根 签名 由 一 系列 根 参数 组 成 

CD3DX12_ROOT_SIGNATURE_DESC rootsigDesc(4，s1lotRootParameter， 
(UINT)staticSamplers.size(), staticSamplers.data(), 
D3D12 ROOT_SIGNATURE FLAG ALLOW INPUT ASSEMBLER INPUT_ LAYOUT); 











到 此 为 上 上， 在 绘制 泻 染 项 之 前 ， 我 们 惑 能 在 每 帧 中 一 次 性 绑 定 所 有 
材质 与 纹理 的 SRV， 而 不 必 将 每 个 演 染 项 依次 进行 绑 定 。 而 后 ， 只 需 为 
每 个 演 染 项 设置 其 对 应 的 物体 常量 缓冲 区 即 可 : 





void CameraAndDynamicIndexingApp::Draw(const GameTimer& gt) 


{ 


auto passCB = mCurrFrameResource->PassCB->Resource( ) ; 
mCommandList->SetGraphicsRootConstantBufferView(1, passCB- 
>GetGPUVirtualAddress()); 

















// 绑 定 场景 中 要 用 到 的 所 有 材质 。 对 于 结构 化 缓冲 区 而 言 ， 我 们 能 绕 开 描述 符 堆 而 直接 











将 其 设置 为 根 描述 
// 符 
auto matBuffer = mCurrFrameResource->MaterialBuffer->Resource(); 
mcCommandList->SetGraphicsRootSshaderResourceView(2， 
matBuffer->GetGPUVirtualAddress()); 























// 绑 定 场景 中 需要 的 所 有 纹理 。 可 以 发 现 ， 我 们 仅 须 指定 表 中 的 第 一 个 描述 符 。 而 根 签 
名 将 自行 推断 描述 符 表 
// 里 到 底 含 有 多 少 个 描述 符 
mCommandList->SetGraphicsRootDescriptorTable(3, 
mSrvDescriptorHeap->GetGPUDescriptorHandleForHeapStart()); 



































DrawRenderItems(mCommandList.Get(), mOpaqueRitems); 


. 5 


void CameraAndDynamicIndexingApp::DrawRenderItems( 
ID3D12GraphicsCommandList* cmdList， 
const std: :Vector& ritems ) 


{ 


// 针对 每 个 泻 染 项 .. . 
for(size t i = 6; i «< ritems.size(); ++i) 
{ 


auto ri = ritems[i]; 





cmdList->SetGraphicsRootConstantBufferView(6@, objCBAddress); 


cmdList->DrawIndexedInstanced(ri->IndexCount, 1,， 
ri->StartIndexLocation, ri->BaseVertexLocation, 0); 





可 以 看 到 ，0ObjectConstants 结 构 体 中 己 含有 了 MaterialIndex 
字段 。 为 此 字段 设置 的 值 应 当 与 在 材质 常量 缓冲 区 中 引用 对 应 材质 数据 
所 用 的 索引 值 相同 : 

















// 更 新 物体 常量 缓冲 区 .…. 





ObjectConstants objConstants; 
XMStoreFloat4x4(&objConstants.World, XMMatrixTranspose(world)); 
XMStoreFloat4x4(&objConstants.TexTransform, XMMatrixTranspose(texTransform 


)); 


objConstants .MaterialIndex = e->Mat->MatCBIndex; 








按 下 列 加 粗 字 体 的 部 分 修改 着 色 器 代码 以 示范 动态 索引 的 用 法 : 








// 此 头 文件 包含 光照 所 需 的 结构 体 与 函数 


#include "LightingUtil.hlsl" 





// 每 种 材质 所 用 到 的 不 同 常量 数据 
struct MaterialData 


{ 








float4 DiffuseAlbedo; 
float3 FresnelRe; 
float Roughness; 
float4x4 MatTransform; 
uint DiffuseMapIndex; 
uint MatPadQ; 

uint MatPad1; 

uint MatPad2; 

}; 


// 一 种 只 有 着 色 器 模型 5.1+ 才 支持 的 纹理 数组 。 与 Texture2DArray 类 型 数组 不 同 的 是 ， 此 
数组 中 所 存 纹 
// 理 的 尺寸 与 格式 可 各 不 相同 ， 这 使 它 比 一 般 的 纹理 数组 更 为 灵活 
Texture2D gDiffuseMap[4] : register(t6); 




























































































// 将 此 材质 结构 化 缓冲 区 置 于 space1 中 ， 使 纹理 数组 不 会 与 这 些 资源 相 重 登 。 而 纹理 数组 
将 占用 寄存 器 te@， 

// t1，..，t3 中 的 space6 空 间 

StructuredBuffer gMaterialData : register(t96，space1); 
































SamplerState gsamPpointWrap : register(sQ); 
SamplerState gsamPointClamp : register(s1); 
SamplerState gsamLinearWrap : register(s2); 
SamplerState gsamLinearClamp : register(s3); 


SamplerState gsamAnisotropicWrap : register(s4); 
SamplerState gsamAnisotropicClamp : register(s5); 














// 每 一 帧 都 有 所 变化 的 常量 数据 
cbuffer cbPerObject : register(b6) 
{ 








float4x4 gWorld; 
float4x4 gTexTransform; 
uint gMaterialIndex; 
uint gObjPado@; 
uint gObjPad1; 
uint gObjPad2; 

}; 


// 绘制 过 程 中 所 用 的 杂项 常量 数据 
cbuffer cbPass : register(b1) 
{ 

float4x4 gView; 

float4x4 gInvView; 

float4x4 gProj; 

float4x4 gInvProj; 

float4x4 gViewProj; 

float4x4 gInvViewProj; 

float3 8gEyePosW; 

float cbPerObjectPad1; 

float2 gRenderTargetSize; 

float2 gInvRenderTargetSize; 

float gNearz; 

float gFarz; 

float gTotalTime; 

float gDeltaTime; 

float4 gAmbientLight; 











// 对 于 每 个 以 MaxLights 为 光源 数量 最 大 值 的 对 象 来 说 ， 索 引 [6，NUM_DIR_LIGHTS) 表 
示 的 是 方向 

// 光源 索引 [NUM_DIR_LIGHTS，NUM_DIR_LIGHTS+NUM_POINT_LIGHTS) 表 示 的 是 点 光源 

// 索引 [NUM_DIR LIGHTS+NUM _POINT_LIGHTS，NUM _DIR_LIGHTS+NUM_POINT_LIGHT 
+NUM_SPOT 

// LIGHTS) 则 表示 的 是 聚光灯 光源 

Light gLights[MaxLights]; 
}; 











struct VertexIn 

{ 
float3 PosL : POSITION; 
float3 NormalL : NORMAL ; 
float2 TexC : TEXCOORD ; 


}; 


struct VertexOut 

{ 
float4 PosH : SV_POSITION; 
float3 PosW : POSITION; 
float3 NormalW : NORMAL; 
float2 TexC : TEXCOORD; 


}; 


VertexOut VS(VertexIn vin) 


{ 
VertexOut vout = (VertexOut)0.0ef; 





// 获取 材质 数据 
MaterialData matData = gMaterialData[gMaterialIndex]; 














// 把 顶点 变换 到 世界 空间 
float4 posW = mul(float4(vin.PosL, 1.6f), gWorld); 
Vvout .PosN = posW.xyz; 























// 假设 这 里 进行 的 是 等 比 缩放 ， 否 则 需要 使 用 世界 矩阵 的 逆转 置 矩 阵 进行 计算 
vout .NormalN = mul(vin.NormalL, (float3x3)gWorld); 


























// 将 顶点 变换 到 齐 次 裁剪 空间 
vout .PosH = mul(posNW，gViewProj); 











// 为 三 角形 插值 而 输出 顶点 属性 
float4 texC = mul(float4(vin.TexC，6.6f，1.6f)，gTexTransform) ; 
vout .TexC = mul(texC，matData.MatTransform) .xy; 























return vout; 


} 


float4 PS(VertexOut pin) : SV_Target 
{ 
// 获取 材质 数据 
MaterialData matData = gMaterialData[gMaterialIndex]; 
float4 diffuseAlbedo = matData.DiffuseAlbedo; 
float3 fresnelR6 = matData.FresnelRO; 
float roughness = matData.Roughness; 
uint diffuseTexIndex = matData.DiffuseMapIndex; 























// 在 数组 中 动态 地 查找 纹理 
diffuseAlbedo *= gDiffuseMap[diffuseTexIndex] .Sample(gsamLinearWrap, pin 
.TexC); 






























































// 对 法 线 插值 可 能 造成 其 非 规 范 化 ， 因 此 要 为 它 再 次 进行 规范 化 处 理 


pin.NormalW = normalize(pin.NormalW); 





// 经 表面 上 一 点 反 财 向 观察 点 的 向 量 
float3 toEyeW = normalize(gEyePosW - pin.PosW); 








// 光照 项 
float4 ambient = gAmbientLight*diffuseAlbedo; 


Material mat = { diffuseAlbedo, fresnelR@, roughness }; 
float4 directLight = ComputeLighting(gLights, mat, pin.PosW, pin.NormalW 


toEyeW ) ; 


float4 litColor = ambient + directLight; 


// 从 漫 反 射 反照 率 获 取 alpha 值 的 常用 手段 
litColor.a = diffuseAlbedo .ai 


return litColor; 





以 上 着 色 器 代码 显 式 地 指明 了 寄存 器 空间 : 


StructuredBuffer gMaterialData : register(t0, space!l); 


硅 非 如 此 ， 那 么 其 默认 的 寄存 占 空 间 为 space0。 通 过 指定 此 空间 ， 
我 们 束 可 以 使 用 着 色 咒 寄存 器 的 其 他 维度 ， 以 防 资 源 重 琶 。 例 如 ， 我 们 
可 以 赁 下 列 方式 将 多 种 资源 存 于 寄存 器 t0 的 不 同 空 间 之 中 : 


Texture2D gDiffuseMap : register(t8@, space®); 


Texture2D gNormalMap : register(t8@, spacel); 
Texture2D gShadowMap : register(t8@, space2); 





当 数 据 为 资源 数组 时 ， 此 法 颇 有 成 效 。 例 如 ， 下 列 具 有 四 个 元 素 的 
纹理 数组 占用 了 寄存 器 t0、t1、 了 2 以 及 t3: 


Texture2D gDiffuseMap[4] : register(t0); 


由 此 ， 我 们 便 可 以 推算 出 下 一 个 可 用 的 空闲 寄存 器 为 人， 或 者 直接 
使 用 一 个 新 的 寄存 器 空间 而 不 必 在 此 问题 上 思虑 过 多 : 








// 将 结构 化 缓冲 区 存 于 space1 中 ， 这 样 一 来 ， 纹 理 数 组 就 不 会 与 之 重合 了 














// 纹理 数组 将 会 占用 寄存 器 te6，t1，...， t3 中 的 space6 空 间 





StructuredBuffer<MaterialData> gMaterialData : register(t0, spacel); 





在 此 ， 我 们 以 动态 索引 的 其 他 3 种 用 法 作为 本 布 的 结束 。 


1. 将 有 看 不 同 纹理 的 邻近 网 格 合并 为 一 个 单独 的 温 染 项 ， 这 样 一 
来 ， 仅 需 一 次 绘制 调用 就 能 把 它们 全 部 绘制 出 来 。 可 以 把 这 些 网 格 的 纹 
理 与 材质 数据 保存 为 项 点 结构 体 中 的 一 个 属性 。 








2. 在 含有 不 同 大 小 与 不 同 格式 纹理 的 单 次 泻 染 过 程 中 ， 使 用 多 纹 
理 贴图 技术 (multitexturing〉。 


3. 以 系统 值 SV_InstanceID 作 为 索引 来 实例 化 具有 不 同 纹理 与 不 
同 材质 的 演 染 项 。 我 们 将 在 下 一 章 中 见 到 相关 的 示例 。 


15.6 小结 





1. 我 们 通过 指定 摄像 机 的 位 置 与 朝向 来 定义 摄像 机 坐标 系 。 该 坐 
标 系 的 位 置 是 根据 相对 于 世界 坐标 系 的 位 置 问 量 来 加 以 确定 的 ， 而 它 的 
明 问 则 由 其 相对 于 世界 坐标 系 的 右 癌 量 、 上 问 量 和 观察 癌 量 来 指定 。 移 
动 摄像 机 就 相当 于 : 相对 于 世界 坐标 系 移动 摄像 机 坐标 系 。 








2. 我 们 将 与 投影 相关 的 数据 纳入 了 摄像 机 类 ， 因 为 透视 投影 窍 阵 
可 视 为 摄像 机 的 “镜头 ”， 以 此 便 能 调整 视 锥 体 的 视 场 朋 、 近 平面 与 远 平 
面 。 


3. 治 着 摄像 机 的 观察 癌 量 前 后 平移 摄像 机 即 可 轻松 实现 视角 的 前 
进 与 后 退 。 按 摄像 机 的 右 癌 量 平移 即 可 实现 镜头 的 左右 移动 。 全 于 俯仰 
观察 ， 可 以 令 摄 像 机 绕 其 右 回 量 旋转 来 完成 。 而 问 左 、 辐 右 巡 视 可 通过 
使 所 有 的 基 癌 量 绕 世界 空间 的 y 轴 旋转 来 实现 。 








4. 动态 索引 是 着 色 器 模型 5.1 引 入 的 新 搁 术 ， 它 使 我 们 可 以 对 具有 
不 同 大 小 及 格式 纹理 的 数组 进行 动态 索引 。 此 技术 的 一 项 应 用 是 : 在 我 
们 绘制 每 一 帧 画面 时 ， 可 一 次 性 绑 定 所 有 的 纹理 描述 符 ， 随 后 ， 在 像素 
独 色 器 中 对 纹理 数组 进行 动态 索引 来 为 像素 找到 它 所 对 应 的 纹理 。 





15.7 练习 


1. 给 出 世界 空间 各 坐标 轴 及 其 原点 的 世界 坐标 : i 一 (1,0,0)、 





了 = (010、K = (00.0 和 O = (0,0,0)， 以 及 观察 空间 诸 坐标 轴 及 其 原点 
的 世界 坐标 : 1 = (Ur. Uy, UL、 NA Uy, Us 外 Ww = (Wr, Wy, w:) 和 


Q = (8 Qy, 8:)， 利 用 点 积 推导 出 下 列 形式 的 观察 矩阵 ; 











(还 记得 吗 ? 要 求 出 由 世界 空间 到 观察 空间 的 变换 和 矩阵， 我 们 只 需 
描述 出 世界 空间 各 坐标 轴 及 其 原点 相对 于 观察 空间 的 坐标 。 接 下 来 ， 再 
把 这 几 个 坐标 作为 观察 矩阵 的 行 回 量 。) 





2. 修改 摄像 机 演示 程序 ， 使 它 文 持 “ 横 滚 ”roll) 动作 ， 束 是 使 摄 
像 机 组 其 观察 癌 量 旋转 ， 令 视角 实现 “ 侧 滚 翻 *。 这 对 于 飞行 类 游戏 而 言 
征 必 不 可 少 的 因素 。 


3. 假设 现 有 这 样 一 个 场景 : 内 会 5 个 位 置 与 纹理 各 不 相同 的 正方 
体 。 创 建 一 个 网 格 存 储 这 5 个 处 于 不 同位 置 的 立方 体 ， 再 为 它们 统一 创 
嫂 一 个 渔 染 项 。 最 后 同 项 点 结构 体 添 加 一 个 字段 用 于 索引 纹理 。 举 个 例 
子 ， 立 方 体 0 上 的 顶点 应 被 上 映射 为 索引 0 所 指 同 的 纹理 ， 因 此 立方 体 0 将 
被 纹理 0 所 演 染 。 同 理 ， 立 方 体 1 上 的 顶点 应 被 贴 上 索引 1 所 指向 的 纹 
理 ， 因 此 立方 体 1 将 被 绘制 为 纹理 1， 并 以 此 类 推 。 在 每 一 帧 都 把 这 5 种 





纹理 与 流水 线 绑 定 一 次 ， 并 在 像素 着 色 器 中 用 顶点 结构 体内 的 索引 来 选 
取 对 应 的 纹理 。 注 意 ， 我 们 要 在 一 次 绘制 调用 过 程 中 ， 用 五 种 不 同 的 纹 
理 来 演 染 这 5 个 立方 体 。 如 果 绘 制 调用 (draw call) 成 为 了 应 用 程序 中 的 
短 贷 ， 不 妨 尝 试 像 本 练习 所 做 的 那样 ， 将 邻近 的 几何 体 合 并 到 一 个 洽 染 
项 中 ， 借 此 令 程序 的 性 能 得 到 优化 。 





第 16 草 ”实例 化 与 视 锥 体 剔 除 


本 章 将 介绍 实例 化 与 视 锥 体 吻 除 的 相关 知识 。 实 例 化 技术 第 用 于 对 
场景 中 同一 对 象 反 复 绘制 多 次 的 情形 。 它 所 带 来 的 优化 效果 显著 ， 所 以 
Direct3D 专 门 为 此 提供 了 支持 。 视 锥 体 吻 除 拉 术 则 是 通过 简单 的 测试 将 
位 于 视 锥 体外 的 整 组 三 角形 从 后 续 的 处 理 流 程 中 剔除 出 去 。 


学 习 目 标 : 
1. 学 习 如 何 实现 硬件 实例 化 。 


2. 熟悉 包围 体 (bounding volume) ， 了 解 这 种 辅助 几何 体 备 受 青 
睐 的 原因 以 及 它们 的 使 用 方法 。 


3. 探索 实现 视 锥 体 剔 除 技术 。 


16.1 硬件 实例 化 


实例 化 技术 和 见于 同一 对 象 在 场景 中 家 绘制 多 次 的 情形 ， 而 每 次 绘 
制 时 ， 该 物体 的 位 置 、 绷 癌 、 缩 放大 小 、 材 质 旋 至 纹理 可 能 都 各 不 相 
同 。 下 面 是 儿 个 相关 示例 。 





1. 多 次 绘制 几 种 稍 有 不 同 的 树木 模型 来 构筑 和 森林。 


2. 多 次 泻 染 几 种 略 有 不 同 的 小 行星 模型 来 搭建 小 行星 带 。 


3. 多 次 绘制 几 种 和 有 差 寞 的 人 物 模型 来 营造 巾 扩 的 人 群 。 





要 令 每 个 实例 部 各 目 维 护 一 套 顶 点 数据 与 索 引 数 据 将 极 大 地 耗费 系 
统 资源 。 因 此 ， 我 们 以 存储 一 份 相对 于 其 局 部 空间 的 几何 体 副本 《 即 顶 
点 列表 与 索引 列表 ) 的 方法 来 加 以 取代 。 这 样 一 来 ， 在 多 次 绘制 同一 对 
象 的 过 程 中 ， 每 次 只 要 按 具 体 需求 使 用 不 同 的 世界 矩阵 与 材质 即 可 。 














尽管 此 策略 可 节省 内 存 ， 但 为 绘制 每 个 对 象 而 调用 的 API 开 销 仍然 
可 观 。 即 针对 每 一 个 对 象 ， 我 们 还 必须 为 其 设置 独 有 的 材质 和 世界 和 矩 
阵 ， 再 执行 绘制 命令 。 尽 管 Direct3D 12 经 重新 设计 ， 已 将 Direct3D 11 在 
绘制 调用 过 程 中 所 执行 大 部 分 API 的 开销 降 到 最 低 ， 但 少量 负载 依然 存 
在 。Direct3D 实 例 化 API 使 我 们 可 以 通过 一 次 绘制 调用 构造 出 一 个 对 象 
的 多 个 实例 。 再 者 ， 有 了 动态 索引 (前 一 章 的 主题 ) 的 辅助 ， 实 例 化 技 
术 将 比 Direct3D 11 时 期 更 具 灵 活性 。 





注意 Note 


为 什么 总 是 对 API 的 开销 念念不忘 呢 ? 对 于 Direct3D 11 来 说 ， 由 于 
API 的 开销 而 致使 应 用 变 为 计算 密集 型 (CPU bound) 程序 是 很 普遍 的 
现象 〈 这 意味 着 此 时 的 瓶颈 是 CPU 而 非 GPU) 。 其 中 的 原因 是 关卡 设计 
师 比 较 偏 爱 为 每 个 对 象 用 其 独 有 的 材质 与 纹理 进行 绘制 ， 所 以 在 处 理 每 
一 个 物体 时 都 需要 先 改 变 泻 染 状 态 再 执行 绘制 调用 。 当 每 个 API 调 用 都 
有 极 高 的 CPU 开 销 时 ， 为 了 保证 实时 的 演 染 速度 ， 场 景 的 泻 染 会 被 限制 
为 只 有 数 生 次 的 绘制 调用 。 图 形 引擎 则 会 利用 批 处 理 技 术 batching 
technique， 人 参见 [Wloka03]) 来 最 小 化 绘制 调用 的 次 数 。 硬 件 实例 化 也 
是 如 此 ， 有 关 API 将 按 批 处 理 方式 进行 高 效 绘制 。 








16.1.1 绘制 实例 数据 


说 来 也 许 会 有 些 出 人 意料 ， 在 前 面 各 章 的 演示 程序 中 ， 我 们 其 实 一 
直 都 在 绘制 实例 数据 ! 人 然而， 实例 的 数量 却 为 
1 ( 即 DrawIndexedInstanced 方 法 的 第 二 个 参数 ) : 


cmdList->DrawIndexedInstanced(ri->IndexCount，11， 


ri->StartIndexLocation, ri->BaseVertexLocation, 0); 





第 二 个 参数 InstanceCount 指 定 了 所 要 绘制 的 几何 体 实例 数量 。 如 


果 将 此 值 指 定 为 10， 则 该 几何 体 将 被 绘制 10 次 。 


照 此 方法 单 次 调用 DrawIndexedInstanced 方 法 来 一 次 性 绘制 出 的 
10 个 对 象 仍 不 能 满足 我 们 的 需求 ， 因 为 这 些 物 体 将 拥有 相同 的 材质 与 纹 
理 ， 且 处 于 相同 的 位 置 。 因 此 ， 下 一 步 就 要 解决 怎样 才能 为 每 个 实例 对 
象 指定 它 所 独 有 的 实例 数据 ， 这 样 的 话 ， 我 们 就 能 以 不 同 的 变换 矩阵 、 
材质 与 纹理 演 染 出 真正 有 个 体 差异 的 实例 。 





16.1.2 ”实例 数据 


在 本 书 的 前 一 版 中 ， 实 例 数 据 都 是 自 输 入 装配 阶段 获取 的 。 在 创建 
输入 布局 (input layout) 时 ， 可 以 通过 枚 举 
项 D3D12_INPUT_CLASSIFICATION_PER_INSTANCE_DATA 蔡 代 
D3D12 INPUT_CLASSIFICATION_PER_VERTEX_DATA 来 指定 输入 的 数据 
为 逐 实例 (per-instance) 数据 流 ， 而 非 逐 顶 点 (per-vertex) 据 流 。 随 
后 ， 再 将 第 二 个 顶点 缓冲 区 与 含有 实例 数据 的 输入 流 相 绑 
定 。LHDirect3D 12 仍 然 支持 这 种 向 流水 线 传递 实例 数据 的 方式 ， 但 是 我 
们 要 另 择 一 种 更 为 现代 化 的 方法 。 


这 所 谓 的 “摩登 ?方法 现 是 为 所 有 实例 都 创建 一 个 存 有 其 实例 数据 的 
结构 化 缓冲 区 。 例 如 ， 大 要 将 茶 个 对 象 实例 化 100 次 ， 就 应 当 创 建 一 个 
具有 100 个 实例 数据 元 素 的 结构 化 绥 冲 区 。 接 着 把 此 结构 化 缓冲 区 资源 
绑 定 到 演 染 流水 线 上 ， 并 根据 要 绘制 的 实例 在 顶点 着 色 器 中 索引 相应 的 
数据 。 那 么 ， 怎 样 才能 在 顶点 着 色 需 中 确定 要 绘制 的 实例 呢 ? 为 此 ， 





Direct3D 提 供 了 系统 值 标识 符 SV_InstanceID， 可 供用 户 在 顶点 着 色 器 
中 方便 地 实现 上 述 目的 。 例 如 ， 将 构成 第 一 个 实例 所 用 的 各 顶点 统一 纺 
号 为 0， 把 组 成 第 二 个 实例 所 需 的 诸 顶 点 统一 编号 为 1， 并 依 此 类 推 。 据 
此 ， 我 们 便 能 在 顶点 着 色 器 中 对 结构 化 缓冲 区 进行 索引 来 获取 所 需 的 实 
例 数据 。 下 列 着 色 器 代码 展示 了 这 一 系列 的 工作 流程 : 














// 光源 数量 的 默认 值 
#ifndef NUM_DIR_LIGHTS 

#define NUM DIR LIGHTS 3 
#endif 





#ifndef NUM POINT_ LIGHTS 
#define NUM POINT_ LIGHTS 6 
#endif 


#ifndef NUM SPOT_LIGHTS 
#define NUM SPOT_LIGHTS 6 
#endif 











// 包含 光照 所 需 的 结构 体 与 函数 
#include "LightingUtil.hlsl" 


struct InstanceData 

{ 
float4x4 World; 
float4x4 TexTransform; 
uint MaterialIndex; 
uint InstPado ; 
uint InstPad1; 
uint InstPad2; 

}; 


struct MaterialData 

{ 
float4 DiffuseAlbedo; 
float3 FresnelRe; 
float Roughness; 
float4x4 MatTransform; 
uint DiffuseMapIndex; 
uint MatPadQ; 
uint MatPad1; 
uint MatPad2; 


}; 











// 只 有 着 色 器 模型 5.1+ 才 支持 的 纹理 


























可 由 不 同 大 小 
// 及 不 同 格式 的 纹理 构成 ， 因 此 它 比 
Texture2D gDiffuseMap[7] 





























// 将 下 列 这 两 个 结构 化 缓冲 区 置 于 space1l 中 ， 从 而 避免 纹理 


则 将 占用 te， 
// t1，.……，t6 寄 存 器 的 space6 





StructuredBuffer gInstanceData : 
StructuredBuffer gMaterialData : 


SamplerState 
SamplerState 
SamplerState 
SamplerState 
SamplerState 
SamplerState 


gsamPointwrap 
gsamPointClamp 
gsamLinearWrap 
gsamLinearClamp 


gsamAnisotropicWrap : 
gsamAnisotropicClamp : 


数组 。 与 Texture2 














纹理 数组 更 为 灵活 


: register(t6) 1; 


register(t6， 
register(t1， 


register(s0); 
: register(s1); 
: register(s2); 
: register(s3); 


register(s 








站 








// 每 趟 绘制 过 程 中 都 可 能 会 有 所 变化 

cbuffer cbPass : register(b6) 

{ 
float4x4 
float4x4 
float4x4 
float4x4 











gView; 

gInvView; 

gProj; 

gInvProj; 
float4x4 gViewProj; 
float4x4 gInvViewProj; 
float3 8gEyePosW; 

float cbPerObjectPad1; 
float2 gRenderTargetSize; 
float2 gInvRenderTargetSize; 
float gNearz; 

float gFarz; 

float gTotalTime; 

float gDeltaTime; 

float4 gAmbientLight; 


// 对 于 每 个 以 MaxLights 为 光源 数 
示 的 是 方向 光源 ; 


的 常量 数据 





Darray 类 型 数组 不 同 的 是 ， 此 数组 


与 之 习 























绢 


ba 





























r 








数 数组 


spacel1); 
spacel); 


register(s4); 


5); 











量 最 大 值 的 对 象 来 计 


FHF， 索引 [6，NUM_DIR_LIGHTS ) 表 


// 索引 [NUM_DIR_LIGHTS，NUM_DIR_LIGHTS+NUM_POINT_LIGHTS) 表 示 的 是 点 光源 ; 
// 索引 [NUM_DIR_LIGHTS+NUM_POINT_LIGHTS+NUM_SPOT_ LIGHTS] 表 示 的 是 聚光灯 光 


y 
源 
/小 


Light gLights[MaxLights]; 
}; 





struct VertexIn 

{ 
float3 PosL : POSITION; 
float3 NormalL : NORMAL ; 
float2 TexC : TEXCOORD; 


}; 


struct VertexOut 

{ 
float4 PosH : SV_POSITION; 
float3 PosW : POSITION; 
float3 NormalW : NORMAL; 
float2 TexC : TEXCOORD; 








// 由 于 此 处 使 用 的 修饰 符 是 nointerpolation， 因 此 该 索引 指向 的 都 是 未 经 插值 的 三 角 
形 

nointerpolation uint MatIndex : MATINDEX ; 
}; 








VertexOut VS(VertexIn vin, uint instanceID : SV_InstanceID) 


{ 
VertexOut vout = (VertexOut)0.0ef; 





// 获取 实例 数据 
InstanceData instData = gInstanceData[instanceID]; 
float4x4 world = instData.World; 

float4x4 texTransform = instData.TexTransform; 
uint matIndex = instData.MaterialIndex; 


vout.MatIndex = matIndex; 





// 获取 材质 数据 
MaterialData matData = gMaterialData[matIndex]; 














// 将 顶点 变换 到 世界 空间 
float4 posW = mul(float4(vin.PosL, 1.6f), world); 
Vvout .PosN = posW.xyz; 








// 假设 要 执行 的 是 等 比 缩放 ， 和 否则 就 需要 使 用 世界 矩阵 的 道 转 置 矩 阵 进行 计算 
vout .NormalN = mul(vin.NormalL, (float3x3)world); 




















// 把 顶点 变换 到 齐 次 裁剪 空间 
vout .PosH = mul(posNW，gViewProj); 














// 为 了 对 三 角形 进行 插值 而 输出 顶点 属性 
float4 texC = mul(float4(vin.TexC, 8.6f, 1.6f), texTransform); 
vout.TexC = mul(texC, matData.MatTransform) .xy; 


return vout; 


} 


float4 PS(VertexOut pin) : SV_Target 
{ 
// 获取 材质 数据 
MaterialData matData = gMaterialData[pin.MatIndex]; 
float4 diffuseAlbedo = matData.DiffuseAlbedo; 
float3 fresnelLR6 = matData.FresnelLR9 
float roughness = matData.Roughness; 
uint diffuseTexIndex = matData.DiffuseMapIndex; 














// 在 数组 中 动态 地 查找 纹理 
diffuseAlbedo *= gDiffuseMap[diffuseTexIndex] .Sample(gsamLinearWrap, 
pin.TexC); 





























// 对 法 线 插值 可 能 使 它 非 规 范 化 ， 因 此 需要 再 次 对 它 进 行规 范 化 处 理 
pin.NormalW = normalize(pin.NormalW); 














// 从 表面 上 一 点 指向 观察 点 的 向 量 
float3 toEyeW = normalize(gEyePosW - pin.PosW); 





// 光照 项 
float4 ambient = gAmbientLight*diffuseAlbedo; 


const float shininess = 1.6f - roughness; 

Material mat = { diffuseAlbedo, fresnelR@, shininess }; 

float3 shadowFactor = 1.6f; 

float4 directLight = ComputeLighting(gLights, mat, pin.PosW, 
pin.NormalW, toEyeW, shadowFactor); 


float4 litColor = ambient + directLight; 

















// 从 漫 反 射 反 照 率 获取 alpha 值 的 常用 方法 
litColor.a = diffuseAlbedo.a; 








return litColor; 








可 以 发 现 ， 代 码 中 己 不 见 了 物体 常量 缓冲 区 (cbPerObject) 的 里 
影 。 此 时 ， 每 个 物体 的 数据 将 由 实例 缓冲 区 提供 。 从 代码 中 还 能 看 出 ， 
我 们 是 如 何 通过 动态 索引 来 为 每 个 实例 关联 不 同 的 材质 与 纹理 的 。 最 重 
要 的 是 ， 我 们 可 以 在 单 次 绘制 调用 中 获取 大 量 的 〈 逐 ) 实例 数据 ! 为 了 


完整 性 起 见 ， 现 将 上 述 着 色 避 程序 所 对 应 的 根 签 名 代码 列举 如 下 。 


CD3DX12_DESCRIPTOR RANGE texTable; 
texTable.Init(D3D12 DESCRIPTOR_ RANGE TYPE_SRV, 7, 6, 0); 








// 根 参 数 可 以 是 描述 符 表 、 根 捅 述 符 或 根 常量 
CD3DX12 ROOT_ PARAMETER slotRootPparameter[4]; 












































// 性 能 小 提示 : 按 变 更 频率 由 高 到 低 进 行 排列 ， 效 果 更 佳 

slotRootPparameter[8].InitAsShaderResourceView(6@, 1); 

slotRootPparameter[1].InitAsShaderResourceView(1, 1); 

slLotRootParameter[2].InitAsConstantBufferView(6) 

slotRootPparameter[3].InitAsDescriptorTable(1, &texTable, D3D12 SHADER_ 
VISIBILITY PIXEL); 











auto staticSamplers = GetStaticSamplers(); 











// 根 签 名 由 一 系列 根 参 数 所 组 成 

CD3DX12 ROOT_SIGNATURE DESC rootSigDesc(4, slotRootPparameter, 
(UINT)staticSamplers.size(), staticSamplers.data(), 
D3D12 ROOT_SIGNATURE FLAG ALLOW INPUT ASSEMBLER INPUT_ LAYOUT); 











了 


与 上 一 章 中 所 做 的 工作 一 样 ， 我 们 在 泻 染 每 一 帧 画面 时 都 要 绑 定 一 
次 场景 中 的 全 部 材质 与 纹理 。 因 而 在 每 次 绘制 调用 时 ， 我 们 只 需 再 设置 
存 有 相应 实例 数据 的 结构 化 缓冲 区 即 可 。 





void InstancingAndCullingApp::Draw(const GameTimer& gt) 


{ 


/7 绑 定 此 场景 所 需 的 全 部 材质 。 对 于 结构 化 缓冲 区 而 言 ， 我 们 可 以 绕 过 描述 符 堆 的 使 用 而 
将 其 直接 设置 
// 为 根 描述 符 









































auto matBuffer = mCurrFrameResource->MaterialBuffer->Resource(); 
mCommandList->SetGraphicsRootShaderResourceView(1, matBuffer- 
>GetGPUVirtualAddress()); 


auto passCB = mCurrFrameResource->PassCB->Resource( ) ; 


mCommandList->SetGraphicsRootConstantBufferView(2, passCB- 
>GetGPUVirtualAddress()); 


// 绑 定 泻 染 此 场景 所 用 的 一 切 纹理 








mCommandList->SetGraphicsRootDescriptorTable(3, 
mSrvDescriptorHeap->GetGPUDescriptorHandleForHeapStart()); 


DrawRenderItems(mCommandList.Get(), mOpaqueRitems); 


有 


void InstancingAndCullingApp: :DrawRenderItems( 
ID3D12GraphicsCommandList* cmdList， 
const std::vector<RenderItem*>& ritems) 


// 针对 每 个 渲染 项 ..…… 
for(size t i = 6; i «< ritems.size(); ++i) 


{ 


auto ri = ritems[i]; 





cmdList->IASetVertexBuffers(60, 1, &ri->Geo->VertexBufferView!()); 
cmdList->IASetIndexBuffer(&ri->Geo->IndexBufferView()); 
cmdList->IASetPrimitiveTopology(ri->primitiveType); 


// 设置 此 演 染 项 要 用 到 的 实例 缓冲 区 
// 对 于 结构 化 缓冲 区 来 讲 ， 我 们 可 以 绕 过 描述 符 堆 而 将 其 直接 设置 为 根 擅 述 符 
auto instanceBuffer = mCurrFrameResource->InstanceBuffer- 
>Resource(); 
mCommandList->SetGraphicsRootShaderResourceView( 

0, instanceBuffer->GetGPUVirtualAddress()); 


























cmdList->DrawIndexedInstanced(ri->IndexCount, 
ri->InstanceCount, ri->StartIndexLocation, 
ri->BaseVertexLocation, 08); 





16.1.3 ”创建 实例 缓冲 区 


实例 缓冲 区 存 有 绘制 每 个 实例 所 需 的 数据 ， 它 所 存储 的 信息 与 之 前 
存 于 物体 常量 缓冲 区 中 的 数据 启 为 相似 。 在 CPU 端 ， 我 们 所 定义 的 实例 
数据 结构 是 这 样子 的 : 


struct InstanceData 
{ 


DirectX: :XMFLOAT4X4 World = MathHelper::Identity4x4(); 
DirectX: :XMFLOAT4X4 TexTransform = MathHelper::Identity4x4(); 
UINT MaterialIndex; 

UINT InstancePade; 

UINT InstancePad1; 

UINT InstancePad2; 





因为 泻 染 项 含有 实例 化 次 数 的 相关 信息 ， 所 以 位 于 系统 内 存 中 的 实 
例 数据 也 应 算 作 演 染 项 结构 体 的 组 成 部 分 : 





struct RenderItem 


{ 


std: :Vector<InstanceData> Instances ; 





人 


为 了 使 GPU 可 以 访问 到 这 些 实例 数据 ， 还 需要 用 InstanceData 元 
素 类 型 创建 一 个 结构 化 缓冲 区 。 由 于 该 缓冲 区 是 动态 缓冲 区 〈 即 上 传 绥 
冲 区 ) ， 所 以 就 能 在 每 一 帧 都 对 它 进行 更 新 。 在 例 程 中 ， 我 们 仅 将 可 见 
Cvisible， 指 用 户 视 野 中 可 见 的 物体 实例 的 实例 数据 复制 到 此 结构 化 
缓冲 区 内 〈 这 与 视 锥 体 剔 除 有 关 ， 详 见 16.3 节 ) ， 再 随 着 摄像 机 的 各 方 
问 移 动 及 四 处 观察 对 这 些 可 见 实例 进行 变换 。 用 我 们 上 自 建 的 
UploadBuffer 辅 助 类 创建 动态 缓冲 区 是 极其 方便 的 。 





struct FrameResource 


{ 
public: 


FrameResource(ID3D12Device* device, UINT passCount, 

UINT maxInstanceCount, UINT materialCount); 
FrameResource(const FrameResource& rhs) = delete; 
FrameResource& operator=(const FrameResource& rhs) = delete; 
~FrameResource(); 
































// 在 GPU 未 处 理 完 命令 之 前 ， 不 能 对 其 引用 的 命令 分 配器 进行 重 置 ， 因 此 每 一 帧 都 需要 有 


























它们 自己 的 命令 
// 分 配器 
Microsoft: :WRL: :ComPtr CmdListAlloc; 




































































// 同 理 ， 在 GPU 未 执行 完 命令 之 前 ， 也 不 能 对 其 引用 的 常量 缓冲 区 进行 更 新 ， 因 此 每 一 帧 
都 需要 拥有 它们 

// 自己 的 常量 缓冲 区 

std::unique ptr> PassCB = nullptr; 

std: :unique ptr> MaterialBuffer = nullptr; 




































































// 注意 :在 此 演示 程序 中 ， 实 例 只 有 一 个 泻 染 项 ， 所 以 仅 用 了 一 个 结构 化 缓冲 区 来 存储 实 
例 数据 。 若 要 使 程 
// 序 更 具 通用 性 〈 即 支持 实例 拥有 多 个 泻 染 项 ) ， 我 们 还 需 为 每 个 演 染 项 都 添加 一 个 结构 

化 缓冲 区 ， 并 为 每 
了 
点 多 ， 但 若 不 
// 用 实例 化 技术 ， 要 用 到 的 物体 常量 数据 会 更 多 。 例 如 ， 如 果 要 在 不 使 用 实例 化 技术 的 情 
况 下 绘制 1666 
// 个 物体 ， 就 必须 创建 出 一 个 可 容纳 1666 个 物体 信息 的 常量 缓冲 区 。 但 采用 了 实例 化 技 
能 存储 1666 个 实例 数据 的 结构 化 缓冲 区 即 可 


























































































































std: :unique ptr> InstanceBuffer = nullptr; 


// 通过 围栏 值 将 命令 标记 到 此 围栏 点 。 这 使 我 们 可 以 检测 到 这 些 帧 资源 是 否 还 被 GPU 所 用 
UINT64 Fence = 0; 
}; 

















FrameResource: :FrameResource(ID3D12Device* device, 
UINT passCount, UINT maxInstanceCount, UINT materialCount) 
{ 
ThrowIfFailed(device->CreateCommandAllocator( 
D3D12 COMMAND LIST_TYPE_DIRECT， 
IID PPV_ARGS(CmdListAlloc.GetAddressOof()))); 


PassCB = std::make unique>( 
device, passCount, true); 
MaterialBuffer = std::make unique>( 
device, materialCount, false); 
InstanceBuffer = std::make unique>( 
device, maxInstanceCount, false); 





注意 ，InstanceBuffer 并 非常 量 缓冲 区 ， 所 以 要 将 最 后 一 个 参数 
站 定 为 false。 


16.2 包围 体 与 视 锥 体 


为 了 实现 视 锥 体 剔 除 (frnstum culling) ， 我 们 要 熟知 视 锥 体 与 各 种 
包围 体 (bounding volume， 也 译作 边界 盒 、 外 接 体 等 ) 的 数学 描述 。 包 
围 体 即 近似 于 目标 物体 体积 的 基本 几何 对 象 〈 见 图 16.1) 。 尽 管 包围 体 
只 是 与 物体 的 形状 相近 似 ， 但 是 用 数学 表示 起 来 比较 简单 ， 这 使 它 在 工 
作 中 更 易于 使 用 。 


最 大 值 点 








最 小 值 点 








图 16.1 分 别 以 轴 对 齐 包 围 盒 与 包围 球 来 泻 染 的 网 格 

















16.2.1 DirectXMath 磁 撞 检 测 库 





我 们 接 下 来 要 使 用 的 是 DirectXCollision.h 工 具 库 ， 它 是 DirectXMath 
库 的 一 个 组 成 部 分 。 此 库 提供 了 一 份 常见 几何 图 元 相交 测试 的 快速 实 
现 ， 例 如 有 射线 ( 光 ) 与 三 角形 (ray/triangle〉 相交 检测 、 射 〈 光 ) 线 
与 (包围 ) 盒 (ray/box) 相交 检测 、 盒 盒 (box/box〉 相交 检测 、 合 与 
平面 (box/plane) 相交 检 测 、 盒 与 视 锥 体 (box/frustum) 相交 检测 以 及 


球体 与 视 锥 体 〈sphere/frustum ) 相交 检测 等 。 在 解答 本 章 练 习 3 的 过 程 
中 ， 我 们 将 进一步 探索 此 库 ， 并 熟悉 它 所 提供 的 各 种 功能 。 


16.2.2 ”包围 盒 


网 格 的 轴 对 齐 包 围 盒 〈ais-aigned bounding box，AABB ) 是 一 种 将 
目标 网 格 紧 密 包 围 ， 有 昌 各 面 丝 平行 于 坐标 主轴 的 长 方 体 。 我 们 可 通过 最 
小 点 vmin 与 最 大 点 vmaz 来 描述 AABB( 见 图 16.2)〉 。 通 过 查找 目标 网 格 中 
所 有 顶点 在 rz、 欠 :三 个 坐标 轴 上 上 所 取得 的 最 小 值 ， 我 们 融 能 得 到 AABB 
最 小 值 点 vmin 的 坐标 ， 反 之 ， 授 历 目 标 网 格 中 全 部 顶点 在 rz、y、z 三 个 化 
标 轴 上 可 取 到 的 最 大 值 ， 我 们 即 可 求 出 AABB 最 大 值 点 vmaz 的 坐标 。 











或 者 以 另 一 种 方式 来 表示 AABB: 将 盒 的 中 心 记 作 c、 扩 展 
(extents) 问 量 记 为 e: 后 者 存储 的 是 由 包围 盒 中 心 沿 坐 标 轴 至 各 盒 面 
的 距离 〈 见 图 16.3) 。 





+Y 























图 16.2 用 最 小 值 点 和 最 大 值 点 表示 包围 目标 点 集 的 AABB 


+Y 

















图 16.3 ”用 包围 盒 中 心 与 扩展 向 量 表示 包围 目标 点 集 的 AABB 











DirectXMath 磁 撞 检 测 库 采用 的 古 包围 盒 中 心 与 扩展 向量 组 合 的 表 
达 方 式 : 


struct BoundingBox 


{ 
static const size t CORNER COUNT 


XMFLOAT3 Center; // 包围 盒 的 中 心 
XMFLOAT3 Extents; // 中 心 至 各 盒 面 的 距离 

















将 上 述 两 种 表示 法 相互 转换 也 是 比较 方便 的 。 例 如 ， 若 给 出 定义 包 
围 盒 的 vmin 与 vmz， 则 男 一 种 表示 法 中 的 包围 使 中 心 及 扩展 向 量 可 分 别 
表示 为 


Cc = 0.5(vmin + Umax) 


ee 一 U.DUDmax — Vmin) 


下 面 的 代码 展示 了 我 们 在 本 章 例 程 中 计算 船 通 头 网 格 包围 盒 的 具体 


XMFLOAT3 VvMinf3(+MathHelper: :Infinity，+MathHelper: :Infinity， 
+MathHelper: :Infinity); 

XMFLOAT3 vMaxf3(-MathHelper::Infinity, -MathHelper::Infinity, 
-MathHelper: :Infinity); 


XMVECTOR vMin = XMLoadFloat3(&vMinf3); 
XMVECTOR vMax = XMLoadFloat3(&vMaxf3); 


std: :vector<Vertex> vertices(vcount); 
for(UINT i = 6; i «< vcount; ++i) 
{ 
fin >> vertices[i].Pos.x >> vertices[i].Pos.y >> vertices[i].Pos.z; 
fin >> vertices[il].Normal.x >> vertices[il].Normal.y >> vertices[i].Norma 
过; 


XMVECTOR P = XMLoadFloat3(&vertices[I].Pos); 

















// 将 点 投射 到 单位 球面 上 并 生成 球面 纹理 坐标 
XMFLOAT3 spherePos ; 
XMStoreFloat3(&spherePos, XMVector3Normalize(P)); 














float theta = atan2f(spherePos.z, spherePos.x); 





// 把 角度 theta 限 定 在 [86，2pi] 区 间 内 
if(theta < 0.6f) 
theta += XM 2PI; 





float phi = acosf(spherePos.y); 


float u = theta / (2.6f*XM PI); 
float v = phi / XxM PI; 


vertices[il].TexC = { u, v }; 


vMin = XMVectorMin(vMin, P); 
vMax = XMVectorMax(vMax, P); 


} 


BoundingBox bounds; 
XMStoreFloat3(&bounds.Center, 0.5f*(vMin + vMax)); 
XMStoreFloat3(&bounds.Extents, 8.5f*(vMax - vMin)); 





函数 XMVectorMin 与 XMVectorMax 返 回 的 向 量 分 别 为 


min(w,v) = (min(vr,vr),min(wy,vy),min(u: .v0:),min(tw .vy)) 


max{(u.v) = (Iaxuzruz) Iaxt .vy),max(u: .0.),max( iy,vw)) 





轴 对 齐 包 围 盒 及 其 旋转 操作 





图 16.4 展 示 了 这 样 一 种 情况 : 在 某 坐 标 系 中 的 轴 对 齐 包 围 盒 ， 却 没 
有 与 其 他 不 同 坐 标 系 中 的 坐标 轴 相 对 齐 。 特 别 是 在 局 部 空间 计算 出 的 目 
标 网 格 的 AABB， 需 要 将 它 进 行 变 换 才 能 得 到 世界 空间 中 的 定 癌 包围 盒 
Coriented bounding box，OBB， 也 有 译作 有 向 包围 盒 ) 。 辐 但 在 实际 工 
作 过 程 中 ， 我 们 通 冲 总 是 先 将 网 格 变换 到 其 局 部 空间 里 ， 再 以 局 部 空间 
内 的 轴 对 齐 包围 盒 进行 磁 撞 检测 。 











男 外 ， 我 们 也 能 够 在 世界 空间 中 重新 计算 网 格 的 AABB， 但 是 有 可 
能 得 到 的 是 一 个 与 实际 物体 偏差 较 大 的 “肥胖 型 长 方 体 〈 见 图 16.5〉。 














图 16.4 ”包围 盒 与 5V 标 架 的 坐标 轴 相 对 齐 ， 却 没有 对 齐 于 六》 标 架 的 坐标 划 





























图 16.5 ” 轴 对 齐 于 六》 标 染 的 包围 盒 


还 有 一 种 办 法 ， 即 放弃 轴 对 齐 包围 仗 ， 仪 采用 定 癌 包围 盒 。 此 时 ， 
我 们 只 需 保 存 好 定 同 包围 例 相对 于 世界 空间 的 朝 问 即 可 。DirectX 磁 撞 
检测 库 提供 了 下 述 结构 体 来 表示 定 癌 包围 盒 。 








struct BoundingOrientedBox 


{ 
static const size t CORNER COUNT = 8; 


XMFLOAT3 Center; // 定向 包围 盒 的 中 心 





XMFLOAT3 Extents; // 中 心 到 各 面 的 距离 
XMFLOAT4 Orientation; ”// 表示 包围 盒 旋 转 (box -> world) 的 单位 四 元 数 (unit 9q 
uaternion) 

















注 意 Note 


在 本 章 中 ， 我 们 将 看 到 用 四 元 数 〈quaternion) 表示 的 旋转 / 定 问 操 
作 。 简 单 来 讲 ， 一 个 单位 四 元 数 可 以 像 旋转 矩阵 那样 来 表示 一 种 旋转 动 
作 。 我 们 会 在 第 22 章 详细 讲解 四 元 数 这 一 主题 ， 而 现在 只 要 认识 到 它 可 
以 像 旋转 矩阵 那样 来 表示 旋转 即 可 。 





通过 一 个 给 定 的 点 集 并 借助 DirectX 磁 撞 检 测 库 中 的 下 列 静 态 成 员 
疯 数 ， 我 们 就 能 构建 出 所 需 的 AABB 与 OBB: 


void BoundingBox: :CreateFrompoints( 

_Out BoundingBox& Out， 

_In_ size 七 Count， 

_In reads bytes (sizeof(XMFLOAT3)+Stride*(Count-1)) const XMFLOAT3* ppPoi 
nts, 

_In size t Stride ); 


void BoundingorientedBox: :CreateFromPoints( 

_Out BoundingOrientedBox& Out， 

_In_ size 七 Count， 

_In_reads bytes (sizeof(XMFLOAT3)+Stride*(Count-1)) const XMFLOAT3* ppPoi 
nts, 

_In size t Stride ); 





如 果 我 们 定义 了 顶点 结构 体 如 下 : 


struct Basic32 

{ 
XMFLOAT3 Pos ; 
XMFLOAT3 Normal; 
XMFLOAT2 TeXC 


}; 





并 且 ， 构 成 网 格 所 用 的 顶点 数组 为 : 


std: :Vector<Vertex: :Basic32> Vertices ; 


那么 ， 我 们 就 能 按 下 面 那样 调用 函数 来 生成 包围 盒 : 





BoundingBox box ; 

BoundingBox: :CreateFromPoints( 
box, 
vertices.size()， 


&vertices[6].Pos， 
sizeof(Vertex: :Basic32)); 





函数 中 的 Stride( 步 长 参数 表示 的 是 需要 越过 多 少 字 市 才能 到 
达 下 一 个 顶点 元 素 处 。 


注 意 Note i 


为 了 计算 出 目标 网 格 的 包围 体 ， 我 们 要 在 系统 内 存 中 准备 一 份 可 供 
使 用 的 顶点 列表 副本 ， 并 存在 如 std: :vector 这 样 的 类 型 中 。 这 样 做 的 
原因 是 ，CPU 无 法 从 以 泻 染 为 目的 而 创建 的 顶点 缓冲 区 中 读 取 数据 。 针 
对 这 种 情况 ， 应 用 程序 中 常见 的 做 法 就 是 ， 为 这 种 数据 维护 一 份 存 于 系 
统 内 存 中 的 副本 ， 像 拾取 (picking， 第 17 章 的 主题 与 碰撞 检测 
(collision detection ) 两 种 技术 就 是 这 样 实现 的 。 


16.2.3 包围 球 


网 格 的 包围 球 是 一 种 紧密 围绕 目标 网 格 的 球体 。 我 们 可 以 通过 包围 
球 的 球 心 与 半径 来 描述 它 。 一 种 计算 网 格 包围 球 的 方法 是 先 计算 其 
AABB。 接 下 来 再 求 取 AABB 的 中 心 ， 以 此 作为 该 包围 球 的 球 心 : 


C 一 0.5(Omin 十 Umax) 


包围 球 的 半径 事实 上 是 球 心 c 至 网 格 上 的 任意 顶点 P 之 间 的 最 大 距 


”=zmax 尼 -pl|: pe 网 格 | 








假设 我 们 已 经 计算 出 了 位 于 局 部 空间 中 网 格 的 包围 球 。 经 世界 变换 
之 后 ， 由 于 缩放 操作 的 影响 ， 包 半球 可 能 已 不 再 紧密 于 纸 于 目标 网 格 。 
这 样 一 来 ， 我 们 还 要 对 其 半径 再 次 进行 相应 的 缩放 处 理 。 为 了 弥补 世界 
变换 过 程 中 非 等 比 缩放 所 带 来 的 影响 ， 我 们 一 定 要 将 包围 球 的 半径 按 最 
大 缩放 分 量 进行 缩放 ， 以 便 包 围 球 可 以 完全 “ 包 右 ” 住 变换 后 的 网 格 。 另 
一 种 可 行 的 策略 是 ， 将 所 有 的 网 格 按 与 游戏 场景 相同 的 缩放 比例 进行 建 
模 ， 由 此 来 避免 后 续 的 缩放 变换 。 夺 使 用 此 方法 ， 只 要 将 模型 加 载 入 应 
用 程序 即 可 ， 而 不 需要 再 次 对 它 进 行 缩放 处 理 。 











DirectX 磁 撞 检 测 库 提供 了 下 述 结构 体 来 表示 包围 球 : 


struct Boundingsphere 


XMFLOAT3 Center; // 包围 球 的 球 心 
float Radius; // 包围 球 的 半径 








而 且 ， 还 提供 了 下 列 评 态 成 员 函 数 ， 利 用 一 组 点 集 即 可 创建 包围 
球 : 
void BoundingSphere: :CreateFromPoints( 


_Out BoundingSphere& Out， 
_In_ size 七 Count， 


_In reads bytes (sizeof(XMFLOAT3)+Stride*(Count-1)) const XMFLOAT3* ppPoi 
nts, 
_In size t Stride ); 





16.2.4” 视 锥 体 


我 们 在 第 5 章 中 已 经 对 视 锥 体 有 了 比较 深入 的 了 解 ， 知 道 了 可 以 在 
数学 上 用 左 、 右 、 顶 、 底 、 近 、 远 这 6 个 相交 的 平面 来 指定 视 锥 体 〈 平 
截 头 体 ) 。 现 假设 这 6 个 视 锥 体 平 面 都 是 “内 同 ? 瑚 网 的 ， 如 图 16.6 所 示 。 











图 16.6” 视 锥 体 众 平面 正 半空 间 的 交集 定义 了 视 锥 体 的 空间 范围 





这 种 6 个 平面 的 表示 法 更 便于 开展 视 锥 体 与 包围 体 的 相交 测试 。 


16.2.4.1 构建 视 锥 体 的 众 平面 





构造 视 锥 体 各 平面 的 一 种 简便 方法 是 : 在 观察 空间 中 ， 采 取 以 原点 
为 中 点 、 治 > 轴 正 方 癌 俯 隔 视 锥 体 的 标准 形式 。 此 时 ， 可 根据 在 2 轴 上 至 
原点 的 距离 来 方便 地 确定 近 平 面 与 远 平 面 ， 而 左 平面 与 右 平面 、 顶 平面 











与 底 乎 面 这 两 组 平面 则 既 对 称 又 经 过 原点 《再 次 观察 图 16.6) 。 因 此 ， 

我 们 在 表达 观察 空间 中 的 视 锥 体 时 ， 就 不 必 存 储 所 有 的 平面 方程 ， 只 需 
简单 地 记录 了 项 、 底 、 左 、 右 4 个 平面 的 平面 斜率 ， 以 及 近 平面 与 远 平 面 
在 2Z 轴 上 至 原点 的 距离 即 可 。DirectX 碰 撞 检 测 库 通 过 以 下 结构 体 来 表示 
视 锥 体 : 








struct BoundingFrustum 


{ 
static const size t CORNER COUNT = 8; 














XMFLOAT3 Origin; // 视 锥 体 〈 及 其 投影 ) 的 原点 
XMFLOAT4 Orientation; // 表示 旋转 操作 的 四 元 数 





float RightSlope; // X 轴 上 的 正 斜 率 〈X/Z) ， 即 右 平面 的 斜率 
float LeftSlope; // X 轴 上 的 负 和 斜率 ， 即 左 平面 的 斜率 
float TopSlope; // Y 轴 上 的 正和 斜率 (Y/Z)〉， 即 顶 平面 的 斜率 
float BottomSlope; // Y 轴 上 的 负 和 斜率 ， 即 底 平面 的 斜率 
float Near, Far; // 近 平 面 与 远 平面 在 Zz 轴 上 至 原点 的 距离 


































































































在 视 锥 体 的 局 部 空间 例如 摄像 机 的 观察 空间 〉 中 ，Origin 的 值 
为 0， 且 Orientation 表 示 的 是 恒 等 变 换 ( 即 不 执行 任何 旋转 动作 的 变 
换 ) 。 我 们 也 可 以 通过 指定 Origin 的 位 置 与 四 元 数 Orientation 的 
值 ， 用 来 在 世界 空间 中 对 视 锥 体 进行 定位 并 改变 它 的 萌 辣 。 











若 绥 存 了 摄像 机 视 锥 体 的 垂直 视 场 角 、 纵 横 比 、 近 平面 以 及 远 平 
面 ， 再 辅 以 一 些 简单 的 数学 计算 ， 便 能 确定 出 观察 空间 中 的 视 锥 体 乎 面 
方程 。 当 然 ， 通 过 投影 矩阵 推导 出 观察 空间 中 的 视 锥 体 平 面 方程 也 有 多 
种 办 法 (如 [Lengyel02] 与 [M6uer08] 就 介绍 了 两 种 不 同 的 方案 ) 
DirectXMath 们 撞 检测 库 采 用 下 述 方式 来 求 取 视 锥 体 的 平面 方程 。 在 
NDC (规格 化 设备 坐标 〉 空 间 中 ， 视 锥 体 便 被 包围 在 方 盒 








一 1, 1 x [=1, 1 xl0, 1 这 内 。 因 此 ， 视 锥 体 的 8 个 角 点 (corner) 可 以 简 
化 表示 为 : 
// 用 齐 次 坐标 来 表示 投影 视 锥 体 (projection frustum) 中 的 各 角 点 


static XMVECTORF32 HomogenousPoints[6] = 
{ 








{ 1.6f，8.6f，1.6f，1.6f }， // 计算 右 平 面 斜率 所 用 的 点 ( 远 平 面 右边 中 点 ) 
{ -1.6f，6.6f，1.6f，1.6f }， // 计算 左 平面 斜率 所 用 的 点 ( 远 平 面 左边 中 点 ) 
{ 6.6f，1.6f，1.6f，1.6f }， // 计算 顶 平面 斜率 所 用 的 点 ( 远 平 面 上 边 中 点 ) 
{ 8.6f，-1.6f，1.6f，1.6f }， // 计算 底 平面 斜率 所 用 的 点 ( 远 平 面 下 边 中 点 ) 









































{ 8.6f，68.6f，6.6f，1.6f }， // 计算 近 平面 到 原点 距离 所 用 的 点 ( 近 平 面 中 心 点 




















{ 8.6f, 68.6f, 1.6f, 1.6f } // 计算 远 平面 到 原点 距离 所 用 的 点 ( 远 平面 中 心 点 





我 们 能 够 通过 计算 投影 矩阵 的 逆 和 矩阵 《以 及 齐 次 除法 的 逆 运 算 ， 可 
回顾 第 5 章 中 的 有 关内 容 ) ， 将 NDC 空 间 中 的 8 个 角 点 变换 回 观察 空间 。 
只 要 求 出 了 观察 空间 中 视 锥 体 的 8 个 角 点 ， 我 们 就 能 通过 一 些 简单 的 数 
运算 来 计算 出 各 平面 方程 《再 重申 一 次 ， 由 于 在 观察 空间 中 视 锥 体位 
af 上 且 对 齐 于 主轴 ， 所 以 求 平面 方程 的 过 程 不 会 很 复杂 〉。 在 
DirectX 碰 撞 检 测 库 中 ， 根 据 投 影 窍 阵 计算 观察 空间 中 视 锥 体 的 代码 如 
pl. 


























// 根据 透视 投影 矩阵 来 构建 视 锥 体 。 输 入 的 矩阵 中 只 能 含有 一 个 投影 。 和 奋 有 旋转 、 和 平移 或 缩 
放 变 换 ， 则 会 构 
// 造 出 不 正确 的 视 锥 体 





























_Use decl annotations_ 

inline void XM CALLCONV BoundingFrustum: :CreateFromMatrix( 
BoundingFrustum& Out， 
FXMMATRIX Projection ) 

{ 


// 用 齐 次 坐标 来 表示 投影 视 锥 体 中 的 各 角 点 














static XMVECTORF32 HomogenousPoints[6] = 


{ 


{ 1.6f，6.6f，1.6f，1.6f }， // 计算 右 平面 斜率 所 用 的 点 (位 于 远 平 面 处 ) 
{ -1.6f，6.6f，1.6f，1.6f }， // 计算 左 平面 斜率 所 用 的 点 
{ 60.6f，1.6f，1.6f，1.6f }， // 计算 项 平面 斜率 所 用 的 点 
{ 60.6f，-1.6f，1.6f，1.6f }， // 计算 底 平 面 和 斜率 所 用 的 点 


一 


}; 


6.6f，6.6f，68.6f， 
6.6f，6.6f，1.6f，1.6 


XMVECTOR Determinant; 


XMMATRIX matInverse 


























1.6f }， // 计算 近 平 面 到 原点 距离 所 用 的 点 
f } 








// 计算 远 平 面 到 原点 距离 所 用 的 点 


XMMatrixInverse( &Determinant, Projection ); 


// 计算 位 于 世界 空间 中 的 视 锥 体 诸 角 点 
XMVECTOR Points[6]; 





for( size t i = 6j i < 6; ++i ) 


{ 
// 把 点 变换 至 观察 空间 


Points[i] = XMVector4Transform( HomogenousPoints[i], matInverse ); 


} 


Out.Origin = XMFLOAT3( 60.6f, 86.6f, 6.6f ); 
Out.Orientation = XMFLOAT4( 6.6f，6.6f，6.9f，1.6f ); 





// 计算 各 右 、 
Points[6] = 
De a = 
a = 
points[3] = 








左 、 顶 、 底 4 个 平面 的 斜率 





Points[6] * XMVectorReciprocal( XMVectorSplatz( Points[6] 


Points[1] * XMVectorReciprocal( XMVectorSplatz( Points[1] 


Points[2] * XMVectorReciprocal( XMVectorSplatz( Points[2] 


Points[3] * XMVectorReciprocal( XMVectorSplatz( Points[3] 


Out.RightSlope = XMVectorGetX( Points[6] ); 
Out.LeftSlope = XMVectorGetX( Points[1] ); 
Out.TopSlope = XMVectorGetY( Points[2] ); 
Out.BottomSlope = XMVectorGetY( Points[3] ); 














// 计算 近 平 








| 与 远 平面 帮 























EZ 贡 








1 上 到 原点 的 距离 








Points[4] = 
); 
Points[5] = 
); 


Points[4] * XMVectorReciprocal( XMVectorSplatW( Points[4] 


Points[5] * XMVectorReciprocal( XMVectorSplatW( Points[5] 


Out .Near = XMVectorGetZ( Points[4] ); 
Out .Far = XMVectorGetZ( Points[5] ); 


} 





16.2.4.2 ” 视 锥 体 与 球体 的 相交 检测 


对 于 视 锥 体 剔 除 来 说 ， 我 们 硕 望 执行 的 测试 之 一 便 是 视 锥 体 与 球体 
的 相交 检测 。 从 中 可 得 知 一 个 球体 是 否 与 视 锥 体 相交 。 注 七， 如 果 一 个 
球体 完全 位 于 视 锥 体 中 则 记 作 相交 ， 这 是 因为 我 们 将 视 锥 体 看 作 是 一 种 
体积 ， 而 非 边 界 。 由 于 视 锥 体 是 由 6 个 内 同 (inward facing) 平面 围 成 的 
空间 范围 ， 所 以 它 与 球体 相交 的 测试 过 程 可 以 按 下 列 方式 执行 : 如 果 存 
在 一 视 锥 体 平 面 L， 且 球体 位 于 L 的 负 半 空间 (negative half-space) 之 
内 ， 那 么 我 们 就 判定 该 球体 完全 位 于 视 锥 体 之 外 。 寿 不 存在 这 样 的 平 
面 ， 则 此 球体 与 视 锥 体 相交 。 


因此 ， 视 锥 体 与 球体 的 相交 检测 就 化 简 为 球体 与 〈《 围 成 视 锥 体 ) 平 
面 的 6 次 相交 检测 。 图 16.7 展 示 了 在 球体 与 平面 相交 测试 的 过 程 中 可 能 
会 遇 到 的 几 种 情况 。 设 球体 的 球 心 为 c 且 半径 为 "， 则 球 心 至 平面 的 市 符 
号 (有 向 〉 距 离 为 = nc+d〈 见 附录 C〉。 如 果 全 <"， 则 球体 与 平 
面相 交 ; 奉 k < -r， 那 么 球体 位 于 平面 的 后 侧 ， 如 果 k > r"， 则 球体 位 于 
平面 的 前 侧 ， 且 与 平面 的 正 半空 间 相交 。 鉴 于 视 锥 体 与 球体 相交 检测 的 
目的 ， 如 果 球 体位 于 平面 的 前 侧 ， 我 们 束 认 为 两 者 是 相交 的 ， 因 为 它们 
相交 的 位 置 处 于 平面 所 定义 的 正 半空 间 。 

















图 16.7 球体 与 平面 相交 检测 可 能 会 遇 到 的 几 种 情况 
(a) 下 > 7 且 球体 与 平面 的 正 半 空间 相交 
Cb) 大 < 一 r 且 球体 完全 位 于 平面 后 侧 的 负 半 空间 之 内 
(ec) | 大 | 全 7 且 球 体 与 平面 相交 























BoundingFrustum 类 提供 了 下 列 成 员 函 数 来 测试 球体 与 视 锥 体 是 
否 相 交 。 注 意 ， 为 了 使 检测 结果 有 意义 ， 球 体 与 视 锥 体 必须 位 于 同一 坐 
标 系 内 。 


enum ContainmentType 


{ 








// 对 象 完 全 位 于 视 锥 体 之 外 
DISJOINT = 6， 
// 对 象 与 视 锥 体 的 边界 相交 
INTERSECTS = 1, 
// 对 象 完 全 位 于 视 锥 体 的 空间 范围 之 内 
CONTAINS = 2， 

}; 

















ContainmentType BoundingFrustum: :Contains( 
_In_ const BoundingSphere& sphere ) const; 





注 意 Note 


BoundingSphere 类 中 也 相应 地 含有 一 个 Contains 成 员 函 数 : 


ContainmentType BoundingSsphere: :Contains( 


_In_ const BoundingFrustum& fr ) const; 





16.2.4.3” 视 锥 体 与 轴 对 齐 包 围 盒 的 相交 检测 


视 锥 体 与 AABB 的 相交 检测 和 视 锥 体 与 球体 相交 检测 所 采用 的 策略 
相同 。 由 于 我 们 将 视 锥 体 的 模型 定义 为 6 个 内 同 平 面 围 成 的 体积 ， 所 以 
视 锥 体 与 AABB 的 相交 检测 可 执行 如 下 : 如 果 存 在 一 视 锥 体 平面 L， 且 
有 包围 盒 位 于 L 的 负 半 空间 ， 束 可 推断 此 盒 完 全 在 视 锥 体 之 外 ; 硝 不 存 
在 这 一 平面 ， 我 们 则 判定 此 包围 盒 与 视 锥 体 相 区 。 


因此 ， 视 锥 体 与 AABB 的 相交 检测 可 化 简 为 6 次 AABB 与 平面 的 相交 
检测 。AABB 与 平面 相交 的 测试 算法 如 下 。 先 求 出 穿 过 包围 盒 体 中 心 且 
方向 与 平面 法 线 m” 最 为 接近 的 包围 盒 体 对 角 向 量 " = ?QR 。 根 据 图 16.8 所 
示 可 知 ， 如 果 已 位 于 平面 的 前 侧 ， 则 名 也 一 定位 于 平面 的 前 侧 ， 知 名 位 于 
平面 的 后 侧 ， 那 么 已 也 必定 位 于 平面 的 后 侧 ， 如 果 已 位 于 平面 的 后 侧 而 4 
位 于 平面 的 前 侧 ， 则 包围 盒 与 该 平面 相交 。 











， AABB 与 平面 相交 测试 可 能 会 出 现 的 几 种 情况 。 























是 与 平面 向 量 方向 最 为 相近 的 包围 盒 体 对 角 线 








可 以 通过 下 述 代 码 求 出 方向 最 接近 于 平面 法 回 量 n 的 ?8: 








// 针对 每 个 坐标 轴 x， 
for(int j = 6j j < 3; ++j) 

















{ 
// 找寻 在 此 坐标 轴 上 使 PQ 与 平面 法 线 具 有 相同 方向 的 点 
if( planeNormal[j] >= 6.6f ) 
{ 
P[j] box.minpt[j]; 
Q[j] box.maxPt[j]; 











else 
{ 
P[j] box.maxPt[j]; 
Q[j] box.minpt[j]; 
} 
} 





这 段 代码 将 任务 分 解 为 3 趟 一 维 空间 内 的 操作 ， 以 此 选择 出 使 
Qi 一 户 与 平面 法 线 坐标 "i 具有 相同 符号 的 点 六 与 点 %i( 见 图 16.9)〉。 





m0 Qi — P: 






P: = vMin [i] Qi = vMax [i 


Qi 一 


Qi = vMin [i P= vMax [i] 

















图 16.9 ”上 图 中 ， 位 于 第 i 个 坐标 轴 上 的 法 线 分 量 为 正 值 ， 因 此 我 们 选择 全 一 ?fin li 与 
Qi 二 UMaxi， 这 样 ，Qi 一 也 的 符号 便 与 平面 法 线 坐 标 ni 相 同 。 下 图 中 ， 位 于 第 i 个 坐标 轴 


上 的 法 线 分 量 为 负 值 ， 所 以 我 们 选择 他 二 Max[i]sQi = vMin[i]， 这 样 ，Qi 一 PP 便 具有 
与 平面 法 线 坐标 ni 相同 的 符号 









































BoundingFrustum 类 提供 了 下 列 成 员 函 数 来 测试 AABB 与 视 锥 体 是 
否 相 交 。 注 意 ， 为 了 使 测试 有 意义 ， 务 必 使 AABB 与 视 锥 体位 于 同一 坐 
标 系 中 。 


ContainmentType BoundingFrustum: :Contains( 


_In_ const BoundingBox& box ) const; 


注意 Note Wp 
BoundingBox 类 中 含有 与 之 对 应 的 成 员 函 数 : 


ContainmentType BoundingBox: :Contains( 
_In_ const BoundingFrustum& fr ) const; 


16.3” 视 锥 体 剔 除 








回顾 第 5 章 中 所 学 的 内 容 可 知 ， 硬 件 会 在 裁剪 阶段 自动 丢弃 位 于 视 
锥 体 以 外 的 三 角形 。 但 是 ， 当 我 们 拥有 数 以 百 万 计 的 三 角形 时 ， 仍 需 先 
通过 绘制 调用 将 它们 提交 至 泻 染 流水 线 〈 这 会 产生 API 开 销 ) ， 而 后 再 
传 至 顶点 着 色 器 ， 很 可 能 还 要 经 过 曲面 细 分 阶段 以 及 几何 着 色 器 ， 直 到 
这 些 三 角形 进入 裁剪 环节 才能 执行 丢弃 处 理 。 很 明显 ， 该 流程 的 效率 是 
极其 低下 的 。 





视 锥 体裁 到 的 思路 是 : 利用 应 用 程序 代码 ， 在 高 于 以 三 角形 为 基本 
单元 (per-triangle basis) 的 层级 中 ， 投 组 剔除 三 角形 。 图 16.10 展 示 了 一 
个 简单 的 示例 。 先 来 构建 包围 体 ， 包 围 使 或 包围 球 都 可 以 ， 用 它们 来 包 
围场 景 中 的 每 一 个 物体 。 如 果 包 围 体 与 视 锥 体 不 相交 ， 就 无 须 将 对 应 的 
物体 〈 它 可 能 由 上 于 个 三 角形 构成 ) 交 由 Direct3D 绘 制 。 这 样 一 来 ， 利 
用 开销 不 大 的 CPU 测试 即 可 节省 GPU 资源 ， 使 它 不 必 在 不 可 见 的 几何 图 
形 上 当 费 计算 时 间 。 假 设 有 一 台 视 场 角 为 90” (垂直 方向 和 水 平方 各 的 视 
场 外 都 是 90"，6 个 同样 的 观察 范围 可 严 丝 合 颖 地 者 新 整个 场景 ) 且 远 平 
面 为 无 穷 远 的 摄像 机 ， 该 摄像 机 的 视 锥 体 仅 占 用 世界 空间 的 16。 再 假 
设 物体 在 场景 中 分 布 均 义 ， 则 世界 空间 中 有 5/6 的 物体 会 被 视 锥 体 吻 除 
方法 所 丢弃 。 在 实际 应 用 中 ， 摄 像 机 冲 用 小 于 90" 的 视 场 角 以 及 无 穷 远 的 
远 平 面 ， 也 就 是 说 ， 会 剔除 掉 场 景 中 5/6 以 上 的 物体 。 


























图 16.10 ”被 包围 体 44 与 D 围 起 来 的 物体 完全 位 于 视 锥 体 之 外 ， 所 以 无 须 绘制 它们 。 被 包围 体 C 

围 起 来 的 物体 体积 范围 完全 位 于 视 锥 体 以 内 ， 所 以 要 对 它 进 行 绘制 。 而 被 包围 体 妃 与 书 围 起 来 

的 物体 则 分 为 两 部 分 ， 并 分 列 视 锥 体内 外 ， 因 此 我 们 在 绘制 这 两 个 物体 的 时 候 ， 要 通过 硬件 裁 
前 丢弃 位 于 视 锥 体外 的 那些 三 角形 






























































在 演示 程序 中 ， 我 们 要 在 局 部 空间 中 计算 船 通 头 网 格 的 AABB， 并 
演 染 出 一 个 规格 为 5x 5 x 5 的 骨骸 头 栅 格 ( 见 图 16.11)。 
在 UpdateInstanceData 方 法 里 ， 我 们 为 所 有 的 实例 都 进行 了 视 锥 体裁 
六 。 如 果 某 实例 与 视 锥 体 相交 ， 束 将 它 加 入 存 有 实例 数据 的 结构 化 缓冲 
区 中 的 下 一 个 空 槽 内 ， 并 且 把 计数 器 visibleInstanceCount 加 1。 这 
样 一 来 ， 结 构 化 缓冲 区 前 面部 分 的 数据 就 都 是 可 见 的 实例 了 《当然 ， 这 
个 结构 化 缓冲 区 的 大 小 与 实例 的 数量 相当 ， 为 发 生 所 有 实例 都 可 见 的 情 
况 而 时 刻 准 备 着 ) 。 骼 仍 头 网 格 的 AABB 位 于 局 部 空间 ， 为 了 执行 相交 
检测 ， 一 定 要 将 视 锥 体 变换 到 每 个 实例 的 局 部 空间 中 。 其 实 也 不 必 仅 拘 
泥 于 一 种 空间 的 使 用 ， 比 如 说 ， 我 们 也 可 将 AABB 与 视 锥 体 一 同 变换 到 
世界 空间 。 视 锥 体 吻 除 所 更 新 的 代码 部 分 如 下 : 





XMMATRIX view = mCamera.GetView(); 
XMMATRIX invView = XMMatrixInverse(&XMMatrixDeterminant(view), view); 


auto currInstanceBuffer = mCurrFrameResource->InstanceBuffer .get() ; 
for(auto& e : mAllRitems) 
{ 


const auto& instanceData = e->Instances; 


int visibleInstanceCount = 0; 
for(UINT i = 8; i «< (UINT)instanceData.size(); ++i) 
{ 
XMMATRIX world = XMLoadFloat4x4(&instanceData[i].World); 
XMMATRIX texTransform = XMLoadFloat4x4(&instanceData[i].TexTransform); 


XMMATRIX invWorld = XMMatrixInverse(&XMMatrixDeterminant(world), world 
); 





// 由 观察 空间 到 物体 局 部 空间 的 变换 矩阵 
XMMATRIX viewToLocal = XMMatrixMultiply(invView, invWorld); 























ll 


// 将 摄像 机 视 锥 体 由 观察 空间 变换 到 物体 的 
BoundingFrustum localSpaceFrustum; 
mCamFrustum.Transform(localSpaceFrustum, viewToLocal); 


部 空间 








// 在 局 部 空间 中 执行 包围 盒 与 视 锥 体 的 相交 测试 
if(localSpaceFrustum.Contains(e->Bounds) != DirectX::DISJOINT) 
{ 
InstanceData data; 
XMStoreFloat4x4(&data.World, XMMatrixTranspose(world)); 
XMStoreFloat4x4(&data.TexTransform, XMMatrixTranspose(texTransform)) 














data.MaterialIndex = instanceData[i].MaterialIndex; 


// 将 可 见 对 象 的 实例 数据 写 入 结构 化 缓冲 区 
currInstanceBuffer->CopyData(visibleInstanceCount++, data); 


} 





} 


e->InstanceCount = visibleInstanceCount; 


// 输出 当前 可 见 实例 《也 就 是 本 帧 实际 绘制 出 来 的 实例 数量 ) 的 数目 与 实例 的 总 数 作为 参 
考 信息 
std: :wostringstream outs; 
outs.precision(6); 
outs << L"Instancing and Culling Demo" << 
L” " << e->InstanceCount << 
L" objects visible out of " << e->Instances.sizel(); 
mMainWndCaption = outs.str(); 
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图 16.11 “Instancing and Culling”( 实 例 化 与 视 锥 体 剔 除 ) 演示 程序 的 效果 








尽管 实例 缓冲 区 为 每 个 实例 都 预 留 了 足够 的 空间 ， 但 只 需 绘制 出 编 
号 为 0 到 visibleInstanceCount-1 所 对 应 的 可 见 实 例 即 可 : 


cmdList->DrawIndexedInstanced(ri->IndexCount, 
ri->InstanceCount, 


ri->StartIndexLocation， 
ri->BaseVertexLocation，6); 





图 16.12 展 示 了 开局 与 关闭 视 锥 体 剔 除 技术 的 性 能 差异 。 在 此 示例 
中 ， 知 采用 视 锥 体 剔 除 技术 ， 我 们 仅 癌 泻 染 流水 线 提交 13 个 实例 进行 给 
制 ， 否 则 我 们 要 为 泻 染 流 水 线 递 交 所 有 的 125 个 实例 并 加 以 处 理 。 尺 管 
可 见 的 场景 部 分 都 是 相同 的 ， 但 硝 茶 用 视 锥 体 吻 除 ， 我 们 将 白白 浪费 超 
过 100 个 肯 骨 尖 网 格 的 计算 量 ， 而 这 些 数据 在 裁 蚤 阶段 终 会 被 于 挥 。 每 
个 船 通 头 大 约 由 6 万 个 三 角形 组 成 ， 因 此 会 有 大 量 的 顶点 数据 需要 处 
理 ， 并 且 每 个 网 格 都 有 许多 三 角形 将 被 抛弃 。 通 过 执行 一 次 视 锥 体 与 
AABB 的 相交 测试 ， 我 们 就 能 从 即将 锐 送 至 图 形 流 水 线 的 数据 中 去 掉 6 


万 个 本 无 须 处 理 的 三 角形 这 就 是 视 锥 体 吻 除 技术 的 高 明之 处 。 通 过 
比较 ， 我 们 就 能 在 每 秒 所 绘制 的 帧 数 上 看 出 端倪 。 








DB nstancing and Culling Demo 125 objects visible out of 125 fps 30.000000 mspf 33333332 X | D Instancing and Culling Demo 13 objects visible out of 125 fps: 0.000000 mspf 16.566566 
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图 16.12 ”在 这 两 幅 图 里 ，125 个 实例 中 可 见 的 仅 占 13 个 。( 左 图 〉 在 视 锥 体 剔 除 被 关闭 的 
情况 下 ， 将 一 共 演 染 125 个 实例 ， 泻 染 一 帧 要 花费 33.33 毫 秒 。 
( 右 图 ) 在 开启 视 锥 体 剔 除 的 情况 下 ， 帧 率 加 倍 


16.4 ”小 结 








1. 实例 化 技术 可 用 于 将 场景 中 的 同一 对 象 ， 以 不 同位 置 、 袁 问 、 
缩放 《大 小 ) 、 材 质 与 纹理 等 绘制 多 次 。 为 了 市 约 内 存 资源 ， 我 们 可 以 
仅 创 建 一 个 网 格 ， 再 利用 不 同 的 世界 和 矩阵、 材质 以 及 纹理 向 Direct3D 提 
交 多 个 绘制 调用 。 为 了 避免 资源 变动 和 多 次 绘制 调用 所 融 来 的 API 开 
销 ， 我 们 可 以 给 存 有 全 部 实例 数据 的 结构 化 缓冲 区 绑 定 一 个 SRV， 并 利 
用 SV_InstanceID 系 统 值 在 项 点 着 色 器 中 对 其 进行 吉 引 。 男 外 ， 我 们 还 
可 以 通过 动态 索引 来 索引 纹理 数组 。 单 次 绘制 调用 中 要 泻 染 的 实例 个 数 
由 ID3D12GraphicsCommandList::DrawIndexedInstanced 方 法 的 第 














二 参数 InstanceCount 指 定 。 





2. 包围 体 是 近似 于 目标 物体 体积 的 基本 几何 对 象 。 尽 管 包围 体 仅 
与 目标 物体 的 形状 相似 ， 但 它 的 数学 描述 却 比 较 简 单 ， 这 使 得 它 在 工作 
过 程 中 更 便于 使 用 。 常 见 的 包围 体 有 包围 球 、 轴 对 齐 包围 盒 (AABB) 
以 及 定 同 包围 盒 〈OBB) 等 。 倍 撞 检 测 库 的 DirectXCollision.h 头 文件 中 
定义 了 表示 各 种 包围 体 的 结构 体 、 对 它们 进行 变换 的 多 种 函数 以 及 多 种 
相交 测试 方法 。 





3. GPU 会 在 裁 允 阶段 自动 抛弃 位 于 视 锥 体 之 外 的 三 角形 。 但 是 ， 
那些 终 将 被 裁 檀 的 三 角形 仍 要 先 通 过 绘制 调用 (会 产生 API 开 销 ) 提交 
至 演 染 流水 线 ， 并 经 过 顶点 着 色 器 的 处 理 ， 还 极 有 可 能 传 到 曲面 细 分 阶 
段 与 几何 着 色 器 内 ， 直 到 在 裁 艾 阶段 中 才能 被 丢弃。 为 了 改善 这 种 无 效 
率 的 处 理 流 程 ， 我 们 可 以 采用 视 锥 体 剔 除 技术 。 此 方法 的 思路 是 构建 一 


个 包围 体 ， 包 围 球 、 包 围 盒 都 可 以 ， 使 它们 分 别 包 围场 景 中 的 每 一 个 物 
体 。 如 果 包 围 体 与 视 锥 体 没 有 交集 ， 则 无 须 将 物体 交 给 Direct3D 绘 制 。 
此 法 通过 开销 较 小 的 CPU 测 试 大 大 节省 了 GPU 资 源 的 浪费 ， 从 而 使 它 不 
必 为 看 不 到 的 几何 图 形 * 买 单 ”。 





16.5 练习 


1. 修改 “Instancing and Culling”(〈 实 例 化 与 视 锥 体裁 前 ) 演示 程 
序 : 用 包围 球 代 蔡 其 中 的 包围 盒 。 


2. 在 NDC 空 间 中 ， 平 面 方程 的 形式 异常 简单 。 视 锥 体内 的 所 有 后 
都 被 约束 在 以 下 的 空间 范围 内 : 
—1< rnd<l 
—1< Wynd 1 
0< anac <1 
特别 是 NDC 空 间 中 视 锥 体 的 左 平面 方程 与 右 平面 方程 ， 分 别 为 
z= 一 1 与 7 = 1。 而 在 进行 透视 除法 之 前 的 齐 次 裁 驴 空间 中 ， 视 锥 体 里 的 
所 有 点 则 被 约 束 在 下 列 范 围 之 内 : 


一 纪 近 Th 入 MU 


一 WY 
0 
此 时 ， 视 锥 体 的 左 平 面 被 定义 为 w = 一 Th， 而 右 平面 的 定义 为 
w= Th。 设 M = 已 为 观察 矩阵 与 投影 矩阵 的 乘积 ， 且 v = (7, y, z, 1) 为 
世界 空间 中 视 锥 体内 的 一 点 。 思 考 并 根据 
(Th Yh za 一 DIAMT=ID AT ID AT DAT 3 D. M ,4 来 证 明 位 于 世 


界 空间 中 视 锥 体 的 6 个 内 向平 面 可 分 别 表示 为 : 








(a) 题目 中 的 平面 法 线 丝 指向 视 锥 体 的 内 部 。 这 就 意味 着 由 6 个 边 
界 平面 到 视 锥 体内 部 某 点 的 距离 都 为 正 值 。 换 句 话说 ， 对 于 视 锥 体内 的 
任意 一 点 P， 有 nn:P+4d 之 0。 


(b)》 可 以 观察 到 vw = 1， 因 此 上 述 点 积 公式 均 可 代 以 形 如 
AT 十 By 十 Cz++D= 0 的 平面 方程 。 





(Cc) 大 计算 出 的 平面 法 向 量 并 不 是 单位 长 度 ， 则 可 参考 附录 C 中 如 
何 对 一 个 平面 进行 规范 化 处 理 。 





3. 考察 DirectXCollision.h 头 文件 ， 研 究 它 为 相交 检测 与 包围 体 变换 
所 提供 的 相关 函数 。 


4. 定义 一 个 OBB 上 所 需 的 条 件 有 : 一 个 中 心 点 C，3 个 用 于 定义 OOB 
朝向 的 相互 正 交 的 轴 向 量 ro、7i、r2， 以 及 3 个 分 别 在 OOB 轴 ro、7l1、r2 
方向 上 的 扩展 〈extent) 长 度 ao、&l 和 a2， 借 此 给 出 从 OOB 中 心 至 其 各 
面 的 3 种 距离 长 度 。 





(a) 观察 图 16.13( 图 中 展示 的 是 2D 场 景 ) ， 证 明 OBB 投 影 在 法 

器 量 n 所 定义 的 轴 上 的 “阴影 长度 为 2"， 其 中 
"=|aoro:n|+|ari:n|+t|aro: nl 

(b) 解释 : 上 述 求 取 r 的 公式 中 为 什么 一 定 要 用 绝对 值 ， 而 不 是 
用 7 = (aoro + airl + ar2) :nn 来 计算 其 值 。 

Cc) 推导 出 平面 与 OBB 相 交 检 测 的 方法 ， 用 来 分 别 确定 OBB 位 
于 平面 之 前 、 平 面 之 后 以 及 与 平面 相交 的 这 几 种 情况 。 

(d) AABB 是 OBB 的 一 个 特例 ， 因 此 OBB 的 相交 检测 也 适用 于 


AABB。 但 是 ， 与 AABB 所 对 应 的 求 r 公 式 是 可 以 进一步 化 简 的 。 试 推导 
出 针对 AABB 简 化 后 的 求 r 公 式 。 


Qoro 十 QI 六 






7 三 |aoro .到 | 十 |aam 天 


~ aoro + air1 


图 16.13 平面 与 OBB 相 交 检 测 的 示意 图 





[1] 此 “ 旧 办 法 ”的 思路 可 参见 《Efficiently Drawing Multiple Instances of 
Geometry》(bb173349) 一 文 或 本 书 前 一 版 本 。 


[2] 为 区 别 于 AABB 这 种 特例 而 称 的 包围 盒 ， 也 就 是 任意 阴 癌 的 包围 
盒 。 位 于 物体 局 部 空间 的 OBB 也 称 为 OOBB， 即 object-oriented bounding 


box。 


[3] DirectMath 库 不 定期 调整 ， 因 此 其 下 的 碰撞 检测 库 也 是 如 此 ， 最 新 
版 与 文中 代码 细节 可 能 稍 有 出 入 。 


第 17 草 ”拾取 





本 章 要 讨论 的 问题 是 如 何 来 确定 用 户 通过 鼠标 指针 所 拾取 的 3D 物 
体 〈 或 图 元 ) 〈 见 图 17.1) 。 换 言 之 ， 才 给 出 鼠标 指针 点 击 的 2D 屏 幕 坐 
标 ， 是 否 能 够 确定 投影 到 此 点 上 的 3D 对 象 呢 ?就 此 而 言 ， 为 了 解决 这 
个 问题 ， 在 某 种 意义 上 来 说 ， | 即 
Be zs 间 变 换 到 屏幕 空间 ， 但 此 时 却 要 将 物体 从 屏 

空间 变换 回 3D 空 间 。 话 虽 简 单 ， an 
wa 即 ， 对 应 于 特定 2D 屏 幕 点 的 3D 点 并 不 是 唯一 的 〈 可 能 会 存在 多 
个 3D 点 投影 到 2D 投 影 窗口 中 同一 点 上 的 情况 ， 见 图 17.2〉。 这 样 一 来 ， 
在 确定 拾取 对 象 的 过 程 中 还 存在 着 一 丝 不 明确 之 处 。 然 而 这 并 不 是 非常 
严重 的 问题 ， 因 为 用 户 选取 的 物体 往往 是 距离 摄像 机 最 近 的 那 一 个 。 


©O 


图 17.1 用 户 正 在 选取 多 个 物体 之 中 的 十 二 面体 
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图 17.2 ” 视 锥 体 的 侧 视图 。 不 难看 出 ，3D 空 间 中 有 多 个 点 都 可 以 投影 到 投影 窗口 内 的 同一 个 点 
上 


考虑 图 17.3， 该 图 中 展示 了 这 样 一 个 视 锥 体 。 其 中 ， 位 于 投影 窗口 
中 的 点 P 对 应 于 用 户 在 屏幕 上 单 击 的 点 s。 观 察 此 图 后 可 知 ， 如 果 以 观察 
点 为 起 点 ， 发 出 一 条 罕 过 点 P 的 拾取 出 线 (picking ray) ， 则 此 射线 会 
与 投影 中 含有 点 P 的 物体 相交 ， 在 此 示例 中 的 相交 物体 是 一 个 圆柱 体 。 
据 此 ， 拾 取 方 案 如 下 : 一 旦 计算 出 了 拾取 射线 ， 我 们 就 能 过 有 历 场 景 中 的 
每 一 个 物体 ， 并 检测 此 射线 是 否 与 它 相 交 。 而 与 射线 相交 的 物体 就 是 用 
户 所 拾取 的 对 象 。 正 如 之 前 所 提 到 的 ， 射 线 可 能 会 与 场景 中 的 多 个 物体 
相交 (也 可 能 一 个 相交 的 都 没有 ， 即 用 户 什 么 都 没 选 ) ， 但 是 位 于 射线 
路 径 之 上 的 物体 会 具有 不 同 的 深度 值 。 在 这 种 情况 下 ， 我 们 束 选 择 与 射 
线 相交 且 距 摄像 机 最 近 的 物体 作为 拾取 对 象 。 























图 17.3 ”从 观察 点 发 出 的 一 条 经 点 P 的 射线 会 交 于 投影 中 含有 点 了 的 物体 。 注 意 ， 位 于 投影 窗口 
中 的 投影 点 对 应 于 用 户 在 屏幕 上 点 选 的 点 8 











学 习 目 标 : 


为 了 学 习 如 何 实现 拾取 算法 并 理解 它 的 工作 原理 ， 我 们 将 拾取 过 程 


分 为 4 个 步骤 。 





(a) 根据 用 户 在 屏幕 上 点 选 的 点 s， 求 出 在 投影 窗口 中 与 之 对 应 的 
点 卫 。 


(b) 计算 出 位 于 观察 空间 中 的 拾取 射线 。 此 射线 以 观察 空间 中 的 
原点 作为 起 点 ， 并 经 过 点 P。 


(c) 将 拾取 射线 与 场景 中 用 于 相交 检测 的 模型 变换 到 同一 空间 之 


(d) 确定 与 拾取 射线 相交 的 物体 。 与 射线 相交 且 距 摄像 机 最 近 的 
物体 即 为 用 户 在 屏幕 中 拾取 的 对 象 。 


17.1 屏 贿 空间 到 投影 窗口 的 变换 


我 们 的 首要 任务 就 是 将 用 户 在 屏幕 中 点 选 的 点 变换 为 规格 化 设备 坐 
标 CNormalized Device Coordinates，NDC 人 参见 5.6.3.3 节 ) 。 重 温 用 视 口 
矩阵 (viewport matrix) 将 顶点 从 规格 化 设备 坐标 变换 到 屏幕 空间 的 过 
程 ， 视 口 矩 阵 如 下 : 





0 it 0 0 


人 0 0 MaxDepth — MinDepth 0 
TopLeftX+ YL TopLefty+ = MinDepth 1 
视 口 矩阵 中 的 变量 可 通过 D3D12_VIEWPORT 结 构 体 来 设置 : 


struct D3D12_VIEWPORT 


TopLeftX; 
TopLeftY 


Width ; 
Height 
MinDepth ; 
MaxDepth; 
} D3D12 VIEWPORT; 





对 于 游戏 来 讲 ， 视 口 的 大 小 往往 是 整个 后 台 绥 冲 区 的 尺寸 ， 而 深度 
缓冲 区 的 范围 则 为 0 一 1。 如 此 一 来 ， 视 口 惩 阵 中 所 用 的 变量 将 分 别 为 
TopLeftX =0、 TopLefty =0 MinDepth =0、 MarDepth = 1. 

Width = w 以 及 Height = h， 其 中 ，w 与 分 别 为 后 台 缓 冲 区 的 宽度 与 高 
度 。 假 设 当前 的 设置 方案 正 是 如 此 ， 则 视 口 矩阵 可 化 简 为 : 





U 0 1 @ 
w/2 h/2 0 1 


现 设 Pnac = (Tnde, Yndc; 2nde; 由 为 规格 化 设备 空间 ( 即 一 1 S Tndc < | 
一 1 < ymae < 1 与 0 < zac < ] 所 围 成 的 空间 ) 中 的 一 点 。 将 pwd 变换 到 屏幕 
空间 : 


w/2 0 0 0 


| _ 1 0 —h/2 0 0| |zndw+w —yndh+h 1 
[2 ndc; Yndc; ndc; | 0 0 1] 0 四 DO 3 <7ulc), 


U/2 h/2 0 1 





坐标 ?mace 仅 被 深度 缓冲 区 所 用 ， 而 我 们 在 讨论 拾取 技术 时 并 不 涉及 
任何 与 深度 有 关 的 坐标 。 因 此 ， 仅 需 对 Pa 的 z 坐 标 与 y 坐 标 进行 变换 ， 
即 可 求 出 它 在 2D 屏 幕 空间 中 所 对 应 的 点 忆 一 (zs Ys): 








Tandcetu 十 也 





By 


—Ynac +h 
ys = 





给 定 视 口 的 大 小 以 及 规格 化 设备 坐标 系 中 的 点 Pnac， 我 们 就 能 根据 
上 述 方程 求 出 屏幕 空间 里 的 点 Ps。 然 而 ， 在 实际 的 拾取 情景 中 ， 我 们 却 
要 通过 已 知 的 屏幕 上 一 点 Ps 以 及 视 口 的 大 小 ， 求 出 点 Pnac。 对 上 述 公式 
变形 即 可 得 到 求 取 点 Pnae 的 方程 : 





现在 便 得 到 了 用 户 选取 的 点 在 NDC 空 间 中 的 位 置 。 但 是 ， 要 找到 对 
应 的 拾取 射线 ， 我 们 还 需求 出 此 点 位 于 观察 空间 中 的 屏幕 点 。 在 5.6.3.3 
节 中 ， 我 们 是 通过 令 z 坐 标 除 以 纵横 比 r 来 将 投影 点 从 观察 空间 变换 到 
NDC 空 间 的 : 











因此 ， 知 要 再 变换 回 观 察 空间 ， 仅 需 为 NDC 空 间 中 的 z 坐 标 乘 以 纵 
横 比 即 可 。 用 户 单 击 的 点 在 观察 空间 中 坐标 则 为 : 


Ds 
252 

Tu 一 7 | 一 一 ] 
w 


注 于 Note 和 


由 于 我 们 将 观察 空间 中 投影 窗口 的 高 度 区 间 定 为 [-1 1]， 因 此 投 冉 
到 观察 空间 的 y 坐 标 与 NDC 空 间 中 y 侍 标 是 相同 的 。 











Ey ye Fy d=co 一 RA 
在 5.6.3.1 节 中 ， 我 们 定义 投影 窗口 位 于 距 原 点 t(3) 处 ， 这 里 
的 o 为 垂直 视 场 角 。 由 此 ， 我 们 就 能 发 出 经 过 投影 窗口 上 的 点 (zu 岂 : 四 的 


拾取 射线 。 然 而 ， 若 采用 这 种 方法 ， 我 们 还 需 计算 4 一 “(3)。 对 此 ， 


这 里 给 出 妨 一 种 更 简单 的 处 理 方式 ， 如 图 17.4 所 示 。 
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上 下 
Vy VY, Ty 下， 








图 17.4 根据 相似 三 角形 可 知 ,，d 1 以 及 d 1 


Pm = 0 五 1 = 一 一 一 
又 由 于 在 投影 矩阵 中 ， rtan ($) 卓 tan (3) CE 
节 ) ， 我 们 便 可 将 它们 改写 为 : 
_ 和- 


U 
Po 


(全 


WY 一 
Pll 


这 样 一 来 ， 我 们 就 可 以 令 拾 取 射 线 改 为 穿 过 点 (zu 名 ,上 )， 而 此 射线 
与 通过 点 (zu 辐 'g 的 其 实 也 是 同一 条 拾取 射线 。 计 算 观察 空间 中 拾取 射 
线 的 代码 如 下 : 


void PickingApp: :Pick(int sx, int sy) 


{ 
XMFLOAT4X4 P = mCamera.GetProj4x4f(); 





// 计算 观察 空间 中 的 拾取 射线 


float vx = (+2.6f*sx / mClientWidth - 1.6f) / P(6, 0); 
float vy = (-2.6f*sy / mClientHeight + 1.6f) / P(1, 1); 


// 位 于 观察 空间 中 拾取 射线 的 定义 
XMVECTOR rayOrigin = XMVectorset(6.6f，6.6f，6.6f，1.6f); 
XMVECTOR rayDir = XMVectorSet(vVX，Vvy，1.6f，6.6f); 





注意 ， 拾 取 射线 的 端点 (也 称 为 拾取 射线 的 原点 ) 位 于 观察 空间 的 
原点 ， 这 是 因为 观察 点 就 在 观察 空间 的 原点 处 。 








17.2 ”位 于 世界 空间 与 局 部 空间 中 的 拾取 射线 











我 们 刚刚 获得 了 观察 空间 中 的 拾取 射线 ， 但 是 它 只 可 用 于 处 理 观察 
空间 中 的 物体 。 由 于 利用 观察 矩阵 能 将 几何 体 从 世界 空间 变换 到 观察 空 
间 ， 因 此 ， 借 助 观察 矩阵 的 逆 窍 阵 便 会 使 几何 体 由 观 凤 空 间 变 换 回 世 界 

空间 。 如 果 产 区 = 4 二 tt 为 观察 空间 中 的 拾取 射线 ， 且 V 是 观察 矩阵 ， 
那么 世界 空间 中 的 拾取 射线 则 为 : 











rw(t)}=qV lituV! 
一 dy TT tu 
注意 ， 射 线 的 端点 9 变换 后 是 一 个 点 〈 即 和 = 1) ， 而 射线 方向 ww 变 
换 后 为 一 个 向 量 〈 即 ww =0) 。 


对 于 在 世界 空间 中 物体 的 情景 来 将， 世界 空间 拾取 射线 十 分 有 用 。 
但 是 在 大 多 数 情 况 下 ， 物 体 的 几何 图 形 往往 是 相对 于 其 局 部 空间 来 定义 
的 。 因 此 ， 为 了 执行 拾取 射线 与 物体 的 相交 检测 ， 我 们 一 定 要 将 射线 变 
换 到 物体 所 在 的 局 部 空间 中 。 如 果 W 是 物体 的 世界 和 矩阵， 那么 通过 矩阵 

研一 便 可 将 几何 体 从 世界 空间 变换 到 此 物体 的 局 部 空间 。 因 此 ， 局 部 空 
间 中 的 拾取 射线 则 为 : 


TL (#) = q,W 下 tuvTV7 1 





一 般 来 讲 ， 场 景 中 的 物体 都 有 自己 的 局 部 空间 。 因 此 ， 一 定 要 将 拾 
取 射 线 变 换 到 场景 中 每 个 物体 所 在 的 局 部 空间 ， 才 能 与 之 开展 相交 检 
测 。 





有 读者 能 会 说 ， 不 如 把 网 格 变换 到 世界 空间 再 执行 相交 测试 。 然 
而 ， 这 种 做 法 的 代价 实在 是 太 昂 贯 了 : 一 个 网 格 就 可 能 含有 上 干 个 项 

， 而 我 们 需要 将 所 有 这 些 顶 点 都 变换 到 世界 空间 。 很 明显 ， 还 是 把 拾 
取 身 线 变换 到 物体 所 在 局 部 空间 中 的 做 法 效率 更 高 。 





下 列 代 码 展 示 了 如 何 将 拾取 射线 从 观察 空间 变换 到 物体 的 局 部 衬 
间 : 





// 假设 在 开始 时 用 户 并 没有 拾取 任何 点 ， 因 此 将 拾取 演 染 项 设置 为 不 可 见 


mPickedRitem->Visible = false; 





























// 检测 用 户 是 否 拾 取 了 一 个 不 透明 的 演 染 项 

// 实际 的 应 用 程序 可 能 会 单独 维护 一 个 由 可 选 物体 组 成 的 “拾取 列表 
for(auto ri : mRitemLayer[(int)RenderLayer::0paque]) 

{ 


auto geo = ri->Geo; 
































// 跳 过 不 可 见 的 演 染 
if(ri->Visible == a 
continue; 


XMMATRIX V = mCamera.GetView(); 


XMMATRIX invView = XMMatrixInverse(&XMMatrixDeterminant(V), V); 


XMMATRIX W = XMLoadFloat4x4(&ri->World); 
XMMATRIX invWorld = XMMatrixInverse(&XMMatrixDeterminant(W), W); 


// 将 拾取 射线 变换 到 网 格局 部 空间 
XMMATRIX toLocal = XMMatrixMultiply(invView, invWorld); 


rayOrigin = XMVector3TransformCoord(rayOrigin, toLocal); 
rayDir = XMVector3TransformNormal(rayDir, toLocal); 

















// 为 相交 检测 而 计算 拾取 射线 方向 上 的 单位 长 度 


rayDir = XMVector3Normalize(rayDir); 

















疯 数 XMVector3TransformCoord 与 XMVector3TransformNormal 
都 以 3D 疝 量 作 为 参数 ， 还 需 注 意 的 是 ，XMVector3TransformCoord 函 


数 总 是 把 参数 向 量 的 第 四 个 分 量 认 作 w = 1《〈 即 返回 w = 1 的 同 量 〉， 

而 XMVector3TransformNormal 函 数 则 会 将 参数 癌 量 的 第 四 个 分 量 看 作 
w 二 0《 即 返回 w = 0 的 向 量 ) 。 因 此 ， 我 们 就 能 通过 
XMVector3TransformCoord 函 数 来 变换 点 ， 而 

用 XMVector3TransformNormal 函 数 对 向 量 进 行 变换 。 








17.3 ”射线 与 网 格 的 相交 检 训 


拾取 射线 一 旦 与 网 格 位 于 同一 空间 ， 我 们 就 能 通过 相交 检 训 来 验证 
这 两 者 是 否 相 交 。 以 下 代码 的 功能 是 人 过 ed 用 一 
执行 射线 与 三 角形 的 相交 检测 。 如 果 射 线 与 其 中 的 一 个 三 角形 相交 ， 说 
明 该 射线 一 定 射 中 了 此 三 角形 所 在 的 网 格 ， 人 否则 ， 此 射线 则 与 该 网 格 无 
缘 。 一 般 来 讲 ， 我 们 只 关心 与 射线 相交 且 距 摄像 机 最 近 的 三 角形 ， 因 为 
大 有 多 个 三 角形 全 在 射线 所 经 过 的 路 径 上 ， 则 会 有 多 个 三 角形 与 射线 相 


— 
人 入 
O 

















// 如 果 拾 取 射 线 碰 到 了 网 格 的 包围 盒 ， 那 么 用 户 就 有 可 能 拾取 了 网 格 上 的 一 个 三 角形 。 因 此 











， 我 们 就 应 进 一 
// 步 执行 射线 与 三 角形 的 相交 测试 
// 如 果 拾 取 射 线 没有 碰 到 网 格 的 包围 盒 ， 说 明 用 户 也 一 定 没 有 点 击 到 此 网 格 ， 因 此 也 就 不 必 
进行 射线 与 该 网 
// 格 上 的 三 角形 相交 检测 这 无 用 功 
float tmin = 0.6f; 
if(ri->Bounds.Intersects(rayOrigin, rayDir, tmin)) 
{ 
// 注意 : 对 于 此 演示 程序 来 说 ， 我 们 是 知道 如 何 强制 转换 顶点 与 索引 的 数据 格式 的 。 但 对 
于 不 同 格式 混合 
// 在 一 起 的 情况 而 言 ， 则 需要 用 元 数据 (metadata) 来 执行 强制 类 型 转换 
auto vertices == (Vertex#k )geo->VertexBufferCPU- >GetBufferPointer() ; 
auto indices == (std::uint32 tx)geo->IndexBufferCPU->GetBufferPointer() 









































UINT triCount = ri->IndexCount / 3; 





// 对 找到 的 离 摄 像 机 最 近 的 三 角形 执行 它 与 (拾取 〉 射线 的 相交 检测 
tmin = MathHelper: :Infinity; 
for(UINT i = 6;j i < triCount; ++i) 


{ 
// 此 三 角形 的 索引 
UINT il16 = indices[i * 3 + 0]; 
UINT i1 = indices[i * 3 + 1]; 
UINT i2 = indices[i * 3 + 2]; 


// 构成 此 三 角形 的 顶点 


XMVECTOR ve 
XMVECTOR v1 
XMVECTOR v2 


XMLoadF1loat3(&vertices[i6].Pos) 
XMLoadFloat3(&vertices[i1].Pos); 
XMLoadFloat3(&vertices[i2].Pos); 


// 为 了 找到 距 摄像 机 最 近 的 与 拾取 射线 相交 的 三 角形 ， 我 们 必须 裔 历 网 格 上 的 所 有 三 角 





形 
float t = 0.0f; 
if(TriangleTests::Intersects(rayOrigin, rayDir, ve, v1, v2, t)) 


if(t < tmin) 








// 这 是 目前 距离 摄像 机 最 近 的 一 个 被 拾取 的 三 角形 
tmin = 七 ; 
UINT pickedTriangle = i; 








// 为 被 拾取 的 三 角形 设置 演 染 项 ， 使 我 们 可 以 用 特定 的 “highlight”( 高 亮 突 出 
) 材质 来 对 它 

// 进行 演 染 

mpickedRitem->Visible = true; 

mPickedRitem->IndexCount = 3; 

mpickedRitem->BaseVertexLocation = 90; 


























// 被 拾取 的 泻 染 项 需要 与 被 拾取 的 物体 使 用 相同 的 世界 矩阵 
mpickedRitem->World = ri->World; 
mpickedRitem->NumFramesDirty = gNumFrameResources ; 














// 但 移 到 被 拾取 三 角形 在 网 格 索引 缓冲 区 中 的 索引 处 


mPickedRitem->StartIndexLocation = 3 * pickedTriangle; 





可 以 发 现 ， 在 处 理 拾取 操作 的 过 程 中 ， 我 们 使 用 的 
征 MeshGeometry 类 中 存储 的 网 格 几何 体 在 系统 内 存 中 的 副本 。 这 样 做 
的 原因 是 我 们 无 法 以 读 取 数 据 的 方式 来 访问 GPU 即将 绘制 的 顶点 缓冲 区 
及 索引 缓冲 区 。 因 此 ， 在 使 用 拾取 与 碰撞 检测 这 样 的 技术 时 ， 我 们 种 常 
会 在 系统 内 存 中 存储 一 份 几何 体 的 副本 。 有 时 候 ， 我 们 又 会 以 节约 内 存 
与 计算 能 力 为 目的 来 存储 一 些 精简 化 的 网 格 。 











17.3.1 射线 与 轴 对 齐 包 畦 全 的 相交 检测 


考察 我 们 使 用 的 第 一 个 DirectX 碰 撞 检 测 库 函数 ， 即 用 于 判定 射线 
与 网 格 包 围 盒 是 否 相 交 的 BoundingBox: :Intersects 函 数 。 说 起 来 ， 
这 与 我 们 在 前 一 章 中 谈 及 的 视 锥 体 剔 除 优 化 技术 比较 相似 。 对 场景 中 的 
每 个 三 角形 逐一 执行 与 射线 的 相交 检测 会 使 运算 时 间 大 大 增加 。 此 时 ， 
甚至 包括 远离 拾取 射线 的 网 格 上 的 三 角形 在 内 ， 都 要 一 一 遍历 ， 以 确认 
这 些 网 格 与 射线 完全 没有 交集 ， 整 个 过 程 极其 粗暴 且 低 效 。 对 此 ， 一 种 
常见 的 做 法 是 采用 一 个 接近 于 网 格 的 简单 包围 体 ， 如 包围 球 或 包围 盒 。 
接 下 来 ， 我 们 首先 以 射线 与 包围 体 的 相交 检测 来 取代 射线 与 网 格 的 相交 
测试 。 如 果 射 线 与 包围 体 没 有 交集 ， 则 该 射线 必然 避 开 了 此 三 角形 网 
格 ， 因 而 也 就 无 需 进行 后 续 的 计算 了 。 但 知 射线 与 包围 体 有 交集 ， 那 么 
我 们 就 要 执行 更 精确 的 射线 与 网 格 的 相交 检测 。 假 使 射线 错过 了 场景 中 
大 多 数 的 包围 体 ， 便 会 节省 我 们 不 少 次 的 射线 与 三 角形 相交 检测 。 如 果 
射线 与 包围 盒 相交 ， 则 BoundingBox: :Intersects 函 数 返回 true， 否 则 
返回 false。 该 函数 的 原型 为 : 





bool XM CALLCONV 
BoundingBox: :Intersects( 





FXMVECTOR Origin, // 射线 的 原点 (端点 ) 
FXMVECTOR Direction，// 射线 的 方 同 问 量 ( 必 为 单位 长 度 ) 
float& Dist ); const // 射线 的 相交 参数 





给 定 冉 线 "(H) = 4 二， 则 最 后 一 个 参数 输出 的 是 实际 相交 扣 P 的 冉 
线 参数 i: 


P=7Tlto)=g+tou 


17.3.2 ”射线 与 球体 的 相交 检测 


DirectX 磁 撞 检 测 库 还 提供 了 一 个 射线 与 球体 的 相交 检测 函数 : 


bool XM CALLCONV 
BoundingSphere::Intersects( 


FXMVECTOR Origin, 
FXMVECTOR Direction, 
float& Dist ); const 





为 了 对 这 些 检测 有 更 深入 的 理解 ， 我 们 将 展示 射线 与 球体 相交 测试 
的 推导 过 程 。 球 心 为 c、 半 径 为 r 的 球体 上 一 点 P 满 足 方程 : 


lp—dl=7 





设 ri = 4 二 tu 为 一 条 射线 。 我 们 希望 能 解 得 在 取 与 时 ， 分 别 存 
在 于 球面 上 对 应 两 点 "(41) 与 "(&) 的 球面 方程 ( 即 在 参数 为 41 与 4b 时， 射线 
与 球面 存在 交 后 )。 


六 三 | 的 一 el 
r= (r(t) — ec): (r(t)— ce) 
r=(g+tu—c):(g+tu— ae) 
r=(g—ct+tu):(g—c+tu) 


为 了 便于 表达 ， 我 们 设 m = 4 一 <。 


\ 2 
(m+tu): (mt+tu)=r7 
' 2 2 
Tm . 772 十 24172 .1 十 太公: 到 一 7 


D 2 
tu .1 十 2101 十 77 一 7 一 (0 


这 其 实 就 是 一 个 一 元 二 次 方程 ， 其 中 : 


pm 

如 宁 射 线 方 稀 同 量 为 单位 长 度 ， 则 o = = 1。 知 方程 的 解 都 含有 
虚 部 ， 那 么 射线 与 球体 没有 相交 。 如 果 有 两 个 相同 的 实数 解 ， 那 么 射线 
与 球体 相 切 。 知 得 到 两 个 不 同 的 实数 解 ， 则 射线 穿 过 球面 ， 两 者 有 两 个 
交 点 。 如 宋 得 到 一 正 一 负 两 个 解 ， 则 说 明 射 线 端点 位 于 一 球体 内 ， 射 线 
从 球体 内 射出 ， 负 数 解 的 交点 是 射线 “后 侧 ” 的 交点 《也 惑 是 射线 反问 延 
长 线 与 球体 的 交 扣 )。 这 最 小 的 正 数 解 给 出 的 便 是 与 摄像 机 最 近 的 相交 
参数 。 冲 











17.3.3 ”射线 与 三 角形 的 相交 检测 


为 了 进行 射线 与 三 角形 的 相交 检测 ， 需 要 使 用 DirectX 人 碰撞 检测 库 
中 的 TriangleTests::Intersects 气 数 : 


bool XM CALLCONV 

TriangleTests::Intersects( 
FXMVECTOR Origin， // 射线 的 原点 (端点 ) 
FXMVECTOR Direction，// 射线 的 方向 向 量 〈 单 位 长 度 ) 








FXMVECTOR V6，// 三 角形 顶点 v8 
GXMVECTOR V1，// 三 角形 顶点 v1 
HXMVECTOR V2，// 三 角形 顶点 v2 
float& Dist ); // 射线 的 相交 参数 








设 TlH) = 9 十 专 为 一 条 射线 ， 在 满足 条 件 三 0 三 0 日 x+mu < 1 时 
了 (1 U) 二 Vo 十 v1 一 V0) 十 v(v2 一 V0) 是 一 个 三 角形 ( 见 图 17.5) 。 我 们 
希望 求 出 使 "(4) = Tuw +)( 这 便 是 射线 与 三 角形 的 相交 点 ) 成 立 的 t, u,v 


Tr(t) 一 人 (1、 v) 
q+tu = vot+ uv 一 D0) + uv 一 20) 


一 te 二 Dll 一 20) 十 Upo 一 00) 一 gg 一 D0 





E 交 坐标 系 来 说 ， 射 线 与 





图 17.5 ”相对 于 原点 为 20， 且 坐标 轴 分 别 为 21 20 与 22 20 的 非 了 
三 角形 相交 的 点 P 在 三 角形 所 在 平面 上 的 坐标 为 u,vU) 

















为 了 便于 表示 ， 设 el =v1 一 vo, e2 = v2 一 vo 有 m==g 一 v0， 则 
有 : 


一 tu 十 el 十 We 一 771 


+ + tIft 
WW Cl EC2 u 
+ 1 +L 





思考 矩阵 方程 Az =Dp， 其 中 ， 和 矩阵 4 可 逆 。 根 据 殉 莱 姆 法 则 
(Cramer’s Rule) 可 知 ,， 五 = det Ai/ det4， 用 列 向 量 ? 蔡 换 和 矩阵 4 中 第 ; 





列 的 列 癌 量 即 可 求 得 4;。 因 此 ， 


1 + + 1 直 
t=det Im el e2| /det |—u el es? 
ly 1 中 


二 we 人 
u = det 本 mm €3 

















i 


a brc 


det ~a:(bx 人 cd) 
根据 等 式 人 ， 我 们 便 可 以 将 公式 改写 为 : 


t 一 一 rz (el x ex)/u': (el x ee?) 
uU=u: (mm Xe (el x es) 
vuU=u:(lel Xm)/u: (el x es) 
为 了 优化 运算 过 程 ， 我 们 根据 行列 式 的 性 质 将 矩阵 中 的 列 进行 互 
换 ， 在 此 过 程 中 行列 式 的 符号 会 发 生 改 变 〈 行 列 式 的 基本 性 质 之 一 ) : 





t=e:(m x el)/el: (wxeo2) 
uU=m:(u x es)/el: (ux es) 


v=U:(m x e1)/el: (u x es) 


此 时 ， 我 们 就 可 以 计算 出 又 积 mx el 与 4 x e2， 并 加 以 复 用 。 


17.4 应 用 例 程 


本 章 的 沽 示 程 序 中 将 泻 染 出 一 辆 轿车 的 网 格 ， 并 允许 用 户 通 过 后 击 
鼠标 右键 拾取 其 中 的 三 角形 ， 而 被 选中 的 三 角形 则 会 以 “突出 ”的 高 亮 材 
质 来 进行 绘制 〈 见 图 17.6) 。 要 以 突出 材质 来 渲染 三 角形 ， 我 们 就 需要 
为 它 准备 相应 的 泻 染 项 。 与 本 书 之 前 在 初始 化 阶段 完整 定义 泻 染 项 不 
同 ， 此 时 的 渲染 项 信息 只 能 在 初始 化 时 期 填写 一 部 分 。 这 是 因为 我 们 无 
法 知晓 哪 一 个 三 角形 会 被 拾取 ， 因 此 也 就 更 别提 起 始 索引 的 位 置 与 世界 
窍 阵 了 。 再 者 ， 用 户 也 不 太 可 能 总 是 选中 同一 个 三 角形 。 所 以 ， 我 们 还 
要 为 演 染 项 的 结构 体 添 加 一 个 Visible 属 性 ， 从 而 令 一 个 不 可 见 的 演 染 
项 不 被 绘制 出 来 。 以 下 代码 是 PickingApp: :Pick 方 法 的 部 分 实现 细 
节 ， 演 示 的 内 容 是 我 们 怎样 基于 用 户 所 选 的 三 角形 来 填写 初始 化 时 未 设 
置 的 其 余 泻 染 项 属性 : 











// 在 PickingApp 类 中 ， 绥 存 指向 被 拾取 三 角形 演 染 项 的 指针 
RenderItem* mpickedRitem; 


if(TriangleTests::Intersects(rayOrigin, rayDir, ve, v1, v2, t)) 


if(t < tmin) 

{ 
// 这 是 当前 被 拾取 的 离 摄 像 机 最 近 的 三 角形 
tmin = 七 ; 
UINT pickedTriangle = i; 





























// 为 拾取 的 三 角形 设置 演 染 项 ， 这 样 一 来 我 们 就 能 用 特殊 的 “突出 ”材质 对 它 进行 泻 染 
mpickedRitem->Visible = true; 

mPickedRitem->IndexCount = 3; 

mpickedRitem->BaseVertexLocation = 0; 














// 被 拾取 的 泻 染 项 需要 与 被 拾取 的 物体 使 用 相同 的 世界 矩阵 
mpickedRitem->World = ri->World; 
mpickedRitem->NumFramesDirty = gNumFrameResources; 


// 偏 移 到 被 拾取 的 三 角形 在 网 格 索 引 缓冲 区 中 的 索引 处 


mpickedRitem->StartIndexLocation = 3 * pickedTriangle; 


} 
} 








a| Picking Demo FPS: 2235 Frame Time: 0.447427 (ms) 





图 17.6 ”用 高 亮 黄 色 突 出 显示 被 用 户 拾取 的 三 角形 


在 绘制 完 所 有 不 透明 泻 染 项 之 后 ， 我 们 才 会 对 用 户 选 中 的 泻 染 项 进 
行 绘 制 。 该 泻 染 项 使 用 的 是 一 个 颜色 特殊 的 PSO〈 泻 染 流 水 线 状 态 对 
象 ) ， 利 用 透明 混合 技术 和 比较 函数 
为 D3D12_COMPARISON_FUNC_LESS_EQUAL 的 深度 测试 实现 。 用 户 拾取 
的 三 角形 需要 绘制 两 次 ， 第 二 次 以 突出 的 特殊 高 亮 材 质 进 行 泻 染 。 如 果 
使 用 的 比较 函数 仅 为 D3D12_COMPARISON_FUNC_LESS， 那 么 第 二 次 绘 
制 三 角形 时 深度 测试 将 会 失败 。 


DrawRenderItems(mCommandList.Get(), mRitemLayer[(int)RenderLayer: :Opaque]) 


mCommandList->SetPpipelineState(mpPSOs["highlight"].Get()); 
DrawRenderItems(mCommandList.Get(), mRitemLayer[(int)RenderLayer: :Highligh 


t]); 





17.5 处 经 


. 拾取 是 一 种 根据 用 户 鼠 标 在 屏 侨 中 选择 的 2D 投 影 物体 来 确定 其 
对 应 的 3D 物 体 的 技术 。 





2， 以 观察 空间 的 原点 作为 端点 发 出 一 条 射线 ， 使 它 经 过 投影 窗口 
中 与 用 户 选 择 的 屏幕 点 所 对 应 的 点 ， 这 便 是 拾取 射线 。 





3. 要 对 射线 rW = 42+ 专 进行 变换 ， 可 以 通过 使 用 变换 矩阵 来 转换 
它 的 端点 4 与 方 同 wu 来 实现 。 注 意 ， 射 线 端 点 的 变换 结果 为 一 把 P Cu = 1 
， 而 其 方 回 的 变换 结果 为 一 个 回 量 (w=0) 。 








4. 为 了 检验 射线 与 物体 是 否 相 区， 我 们 要 对 物体 上 的 所 有 三 角形 
一 一 进行 射线 与 三 角形 的 相交 检测 。 如 果 射 线 与 其 中 的 一 个 三 角形 相 
交 ， 则 该 射线 也 必 与 三 角形 所 属 的 网 格 相交 。 合 则 ， ee 
没有 交集 。 一 般 来 讲 ， 我 们 所 需 的 是 与 摄像 机 距离 最 近 的 三 角形 ， 
因为 如 果 有 一 些 三 角形 重合 在 射线 所 经 路 径 当 中 ， sae 
角形 与 财 线 相交 ， 而 用 户 能 看 到 的 为 离 摄像 机 最 近 的 三 角形 。 





5. 一 种 针对 射线 与 网 格 相交 检测 的 性 能 优化 方法 是 : 首先 执行 射 
线 与 近似 于 网 格 的 包围 体 的 相交 检测 。 如 果 射 线 与 包围 体 没 有 交集 ， 则 
出 线 也 必然 不 会 与 此 三 角形 网 格 相交 ， 因 而 也 就 不 需要 再 进行 后 续 的 计 
算 工作 了 。 知 射线 与 包围 体 相 交 ， 那 么 我 们 应 进一步 执行 射线 与 网 格 的 
相交 检测 。 假 如 射线 与 场景 中 的 大 多 数 包 围 体 没有 交集 ， 则 这 个 方案 将 
为 我 们 减少 许多 不 必要 的 射线 与 三 角形 的 相交 检测 。 








17.6 ”练习 


1. 修改 “Picking”( 拾 取 ) 演示 程序 ， 用 网 格 的 包围 球 取代 其 中 的 
AABB. 


2. 研究 射线 与 AABB 相 交 检 测 的 算法 。 


3. 假如 场景 中 有 数 以 生计 的 物体 ， 我 们 还 必须 为 实现 拾取 技术 而 
执行 上 二 次 的 射线 与 包围 体 的 检测 。 那 么 ， 现 请 研究 八 又 树 (octrees) 
这 种 数据 结构 ， 并 解释 如 何 利用 它们 来 减少 射线 与 包围 体 相 交 检 测 的 次 
数 。 同 理 ， 该 策略 也 可 以 推广 到 视 锥 体 剔 除 技术 ， 用 来 减少 这 个 过 程 中 
视 锥 体 与 包围 体 相 交 检 测 的 次 数 。 





[1] 仔细 说 来 ， 射 线 与 球体 共存 在 5 种 位 置 关系 当然， 由 于 拾取 射线 
的 定义 ， 所 以 将 忽略 其 中 的 儿 种 迟 况 )， 男 外 两 种 分 别 为 :两 个 正 实数 
解 ， 在 射线 的 正方 上 与 球体 有 两 个 交点 ; 两 个 负 实数 解 ， 在 射线 的 反 辐 
延长 线 上 与 球体 有 两 个 交点 。 因 此 ， 说 明 冉 线 的 原点 (端点 ) 相 对 于 球 
体 的 位 置 也 很 重要 。 读 者 可 找寻 一 些 融 图 示 的 教程 ， 一 目 了 然 。 





第 18 章 ”立方 体贴 图 


本 章 将 围绕 立方 体 图 (cube map) 展开 讨论 ， 即 以 特殊 的 方式 来 运 
用 这 种 由 6 个 纹理 所 构成 的 基本 数组 。 有 了 这 项 贴图 技术 ， 我 们 就 能 方 
便 地 映射 天 空 纹理 或 模拟 反射 。 


学 习 目 标 : 

1. 学 习 立 方 体贴 图 的 概念 并 用 HLSL 代 码 对 它们 进行 采样 。 
2. 摸索 如 何 利用 DirectX 纹 理工 具 来 创建 立方 体 图 。 

3. 探究 如 何 用 立方 体 图 来 模拟 反射 。 


4. 理解 怎样 通过 立方 体 图 泻 染 球体 ， 并 以 此 技术 来 模拟 天 空 以 及 


18.1 什么 是 立方 体贴 图 


立方 体贴 图 (cube mapping， 也 有 译作 立方 体 纹理 映射 等 ) 的 主要 
思路 是 : 存储 6 个 纹理 ， 将 它们 分 别 看 作 立 方 体 的 6 个 面 一 一 因此 而 得 
名 “立方 体 图 *”。 男 外 ， 此 立方 体 的 中 心 点 位 于 某 坐 标 系 的 原点 ， 且 该 立 
方 体 对 齐 于 该 坐标 系 的 主轴 。 由 于 立方 体 纹理 是 轴 对 齐 的 ， 也 束 是 说 ， 
它 的 每 个 面 各 对 应 于 坐标 系 某 个 方 同 的 主轴 ， 因 此 我 们 可 以 根据 与 面相 
交 的 坐标 轴 方 同 (十, 士 六 士 Z) 来 引用 立方 体 图 的 特定 面 。 








在 Direct3D 中 ， 立 方 体 图 被 表示 为 一 个 由 6 个 元 系 所 构成 的 纹理 数 
组 ， 即 : 





1. 索引 0 援引 的 十 与 +X 轴 相交 的 面 。 








2. 索引 1 援引 的 是 与 -X 轴 相 区 的 面 。 





3. 索引 2 援引 的 是 与 +Y 轴 相交 的 面 。 








4. 索引 3 援引 的 是 与 -Y 轴 相交 的 面 。 








5. 索引 4 援引 的 是 与 +2 轴 相交 的 面 。 





6. 索引 5 援引 的 是 与 -2Z 轴 相交 的 面 。 


寻找 立方 体 图 中 纹 和 又 的 方法 与 普通 的 2D 纹 理 并 不 相同 ， 此 时 不 再 
用 2D 纹 理 坐标 来 指定 纹 素 ， 而 是 要 使 用 3D 纹 理 坐标 : 它 定 义 了 一 个 起 











点 位 于 原点 的 查找 (lookup) 向 量 w。 向 量 w 与 立方 体 图 相交 处 的 纹 素 
( 见 图 18.1) 即 为 e 的 3D 坐 标 所 对 应 的 纹 素 。 我 们 在 第 9 章 中 所 讨论 的 纹 
理 过 滤 思 想 便 贯彻 在 向 量 " 与 纹 素 样本 间 求 取 交 点 的 过 程 当中 。 吕 


MN 








被 采集 的 纹 素 … 











图 18.1 这 里 为 简单 起 见 而 采用 2D 示 意图 ， 因 此 图 中 的 正方 形 即 为 3D 空 间 中 的 一 个 立方 体 。 图 
中 的 正方 形 表示 一 个 中 心 位 于 原点 、 且 轴 对 齐 于 茶 坐 标 系 主轴 的 立方 体 图 。 从 原点 发 射 的 向 量 
D0 与 立方 体 图 相交 处 的 纹 素 即 为 采集 的 目标 纹 素 。 在 此 示意 图 中 ， 与 向 量 v 相 交 的 是 +Y 轴 上 的 

立方体 面 
























































注意 Noe > 
查找 向 量 的 模 并 不 重要 ， 关 键 在 于 它 的 方向 。 而 方向 相同 但 大 小 不 
一 的 两 个 向 量 在 立方 体 图 中 采集 的 实际 是 同一 点 。 




















在 HLSL 中 ， 立 方 体 纹理 用 TextureCube 类 型 来 表示 。 下 列 代 码 片 


/一 二 了 


段 详 尽 地 展示 了 对 立方 体 图 进行 采样 的 方法 : 


TextureCube gCubeMap; 
SamplerState gsamLinearWrap : register(s2); 


// 在 像素 着 色 器 中 
float3 v = float3(x,y,z); // 某 查 找 癌 量 
float4 color = gCubeMap.Sample(gsamLinearWrap,v); 








注 意 Note Wp 


查找 同 量 与 立方 体 图 应 该 位 于 同一 空间 之 中 。 例 如 ， 知 立方 体 图 相 
对 于 世界 空间 而 设 〈 即 立方 体 各 面 彰 与 世界 空间 的 坐标 轴 对 齐 ) ， 则 得 
找 回 量 也 应 当 使 用 世界 空间 坐标 。 








18.2 ”环境 贴图 


立方 体 图 的 主要 应 用 是 环境 由 几 〈environment mapping， 也 有 译作 
环境 映射 等 ) 。 其 思路 是 : 使 视 场 角 为 90”《〈 垂 直 视 场 角 与 水 平视 场 角 皆 
是 如 此 ) 的 摄像 机 位 于 场景 中 某 物 体 的 中 心 点 0 处 。 这 样 一 来 ， 此 摄像 
机 就 能 沿 :z、y、z 三 轴 的 正 、 负 共 6 个 方向 进行 观察 ， 并 以 这 6 个 视角 来 
截取 场景 中 的 图 像 〈 此 物体 D 除 外) 。 由 于 视 场 角 为 900"， 所 以 这 6 张 以 
物体 O 视 角 截 取 的 图 像 ， 涵 盖 了 包围 着 它 的 整个 环境 。 接 着 ， 我 们 把 这 6 
张 周围 环境 图 像 存 于 一 个 立方 体 图 中 ， 这 也 正 是 “环境 图 ”(environment 
map) 这 个 名 字 的 由 来 。 换 句 话 说， 环境 图 就 是 每 个 面 都 存 有 周围 环境 
图 像 的 立方 体 图 。 癌 ] 





根据 以 上 描述 可 知 ， 我 们 需要 为 每 一 个 采用 环境 贴图 的 物体 都 创建 
一 个 环境 图 。 虽 然 这 种 做 法 的 效果 更 为 精准 ， 但 也 要 为 纹理 耗费 更 多 的 
内 存 。 一 种 折 中 的 实现 方案 是 ， 仅 在 场景 中 的 关键 处 截取 少量 环境 图 ， 
为 每 个 物体 采集 场景 中 离 它 们 最 近 的 环境 图 。 在 实际 工作 中 ， 这 种 简化 
的 做 法 在 处 理 曲 面 物体 时 通常 会 很 有 效 ， 因 为 体现 在 它们 表面 上 的 不 精 
确 反 射 很 难 被 用 户 注 意 到 。 另 一 种 常见 的 简化 手段 是 在 采集 环境 图 时 名 
略 场景 中 的 某 些 环境 图 。 例 如 ， 图 18.2 中 的 环境 图 仅 采 集 了 天 空 与 远 山 
这 种 极 远 处 的 “背景 信息， 而 忽略 场景 中 的 物体 。 尽 管 采集 的 只 是 背景 
而 非 整 个 场景 的 环境 图 ， 但 用 这 种 方案 来 创建 镜面 反射 的 时 候 还 是 很 实 
用 的 。 为 了 采集 局 部 物体 ， 我 们 要 通过 Direct3D 来 泻 染 环境 图 中 的 6 幅 
图 像 ， 在 18.5 节 中 有 相关 的 探讨 。 在 本 章 的 演示 程序 〈 见 图 18.3) 中 ， 




















场景 内 的 所 有 物体 都 采用 的 是 如 图 18.2 所 示 的 那 张 环境 图 。 











图 18.2 ”图 中 演示 的 环境 图 是 一 个 “ 拆 开 ”后 的 立方 体 图 。 现 在 假设 将 这 6 个 面 重新 车 回 一 个 3D 
方 体 ， 而 且 我 们 正 置身 于 它 的 中 心 点 处 。 这 时 ， 我 们 在 此 向 四 周 观 察 就 能 看 到 周围 的 环境 了 








如 果 摄 像 机 在 构建 环境 图 时 所 用 的 坐标 轴 方 辐 回 量 为 世界 空间 的 华 
标 轴 癌 量 ， 那 么 就 称 此 环境 图 是 相对 于 世界 空间 而 生成 的 。 当 然 ， 我 们 
可 以 从 一 个 不 同 “ 原 点 >”《〈 例 如 物体 的 局 部 空间 ) 来 捕捉 环境 图 。 但 是 一 
定 要 保证 查找 向 量 的 坐标 与 立方 体 图 处 于 同一 坐标 系 中 。 


由 于 立方 体 图 仅 存 储 纹理 数据 ， 美 工 就 可 以 预先 制作 出 纹理 的 内 容 
(就 像 我 们 之 前 所 用 的 2D 纹 理 一 样 )。 正 因 如 此 ， 我 们 也 就 无 须 通 过 
实时 泻 染 来 计算 立方 体 图 中 的 图 像 了 。 即 我 们 可 以 在 3D 场 景 编辑 器 中 
创建 一 个 场景 ， 并 在 编辑 器 中 预先 泻 染 出 立方 体 图 6 个 面 上 的 图 像 。 对 
于 户外 环境 图 来 讲 ，Terragen 程 序 〈 免 费 供 个 人 使 用 ) 是 一 种 比较 普 氨 
的 选择 ， 它 能 够 创造 出 具有 照片 级 真实 感 的 室外 场景 来 。 我 们 为 本 书 创 
建 的 环境 图 ， 例 如 图 18.2 所 示 的 效果 ， 就 是 借助 Terragen 实 现 的 。 











图 18.3“Cube Map” 立方体 图 ) 演示 程序 的 运行 效果 


注意 Note i 


如 果 尝 试 使 用 Terragen， 我 们 需要 在 Camera Settings (摄像 机 设置 ) 
对 话 框 中 将 zoom 缩放 〉 因 子 设 为 1.0 才 能 使 用 视 场 角 为 90° 的 摄像 机 ， 
而 且 还 需 确 认 图 像 输 出 的 宽度 与 高 度 是 相同 的 ， 以 令 垂 直 视 场 角 与 水 平 
视 场 角 都 为 90"。 昌 ] 











注意 Note 


网 络 上 有 一 个 不 错 Terragen 脚 本 ( 《Skybox (2D) with 
Terragen》) ， 它 会 在 当前 的 摄像 机 位 置 以 90° 的 视 场 角 泻 染 出 6 幅 周 


环境 的 图 像 。 


一 旦 利用 工具 创建 出 立方 体 图 所 用 的 6 幅 图 像 ， 我 们 就 可 以 构建 出 
含有 这 6 幅 图 像 的 立方 体 图 纹理 了 。 我 们 所 用 的 DDS 纹 理 图 像 格式 亦 文 
持 立 方 体 图 ， 利 用 texassemble 工 具 便 可 以 通过 6 幅 图 像 构 建 出 此 格式 的 
立方 体 图 。 下 面 的 例子 展示 了 如 何 用 texassemble 来 创建 一 个 立方 体 图 

(截取 上 自 texassemble 的 相关 文档 〉: 





texassemble cube -w 256 -h 256 -0o cubemap.dds lobbyxpos.jpg lobbyxneg.jpg 





lobbyypos.jpg lobbyyneg.jpg lobbyzpos.jpg lobbyzneg.jpg 


注 让 Note 和 


NVIDIA 为 Photoshop 程 序 提供 了 用 于 存储 DDS 格 式 图 像 与 立方 体 图 
的 插件 。 


通过 Direct3D 加 载 并 使 用 立方 体 图 





正如 前 文 所 述 ，Direct3D 通 过 存 有 6 个 元 素 的 纹理 数组 来 表示 立方 
体 图 。 演 示 程 序 中 的 DDS 纹 理 加 载 代码 (DDSTextureLoader.hy.cpp) 已 
经 文 持 对 立方 体 图 的 加 载 ， 而 且 载 入 其 他 类 型 的 纹理 也 不 在 话 下 。 加 载 


代码 会 检测 出 含有 一 幅 立 方 体 图 的 DDS 文 件 ， 并 创建 纹理 数组 将 每 个 立 
方 体面 的 纹理 数据 载 入 相应 的 元 素 中 。 


auto skyTex = std::make unique<Texture>(); 
skyTex->Name = "skyTex"; 
skyTex->Filename = L"Textures/grasscube18624.dds"; 


ThrowIfFailed(DirectX::CreateDDSTextureFromFile12(md3dDevice.Get(), 
mCommandList.Get(), skyTex->Filename.c_ str(), 
skyTex->Resource, skyTex->UploadHeap)); 





在 为 立方 体 图 纹理 资源 创建 SRV (着 色 器 资源 视图 ) 时 ， 应 将 其 维 
度 指定 为 D3D12_SRV_DIMENSION TEXTURECUBE 有 日 使 用 TextureCube 属 
性 : 


D3D12_SHADER RESOURCE VIEW DESC srvDesc = {}; 
srvDesc.Shader4ComponentMapping = D3D12_ DEFAULT_ SHADER 4 COMPONENT_ MAPPING 
3 


srvDesc.ViewDimension = D3D12 SRV_DIMENSION TEXTURECUBE; 


srvDesc.TextureCube.MostDetailedMip = ©; 

srvDesc.TextureCube.MipLevels = skyTex->GetDesc().MipLevels; 
srvDesc.TextureCube.ResourceMinLODClamp = 6.6f; 

srvDesc.Format = skyTex->GetDesc().Format; 
md3dDevice->CreateShaderResourceView(skyTex.Get(), &srvDesc, hDescriptor); 





18.3 ”绘制 天 空 纹理 


我 们 能 够 利用 环境 图 绘制 天 空 纹理 。 首 先 ， 要 围 经 整个 场景 来 创建 
一 个 巨大 的 球体 。 为 了 营造 出 遥 不 可 及 的 远 山 以 及 天 二 的 错觉 ， 我 们 以 
图 18.4 所 展示 的 方法 ， 通 过 环境 图 来 为 球体 绘制 纹理 。 这 种 方法 的 思路 
就 是 将 纹理 图 投影 到 球面 之 上 。 


被 采集 的 纹 素 














图 18.4 ”为 了 简单 起 见 ， 这 里 展示 的 是 2D 示 意图 ; 因此， 图 中 的 正方 形 即 为 3D 空 间 中 的 立方 体 

(图 ) ， 而 圆 形 即 为 3D 空 间 中 的 《天空 ) 球体 。 假 设 天 空 球 与 环境 图 都 以 同一 个 空间 中 的 原点 

为 中 心 。 接 下 来 ， 为 了 向 球面 上 的 点 投影 纹理 ， 我 们 把 端点 为 原点 的 向 量 作为 查找 向 量 射 向 球 
面 。 以 此 将 立方 体 图 投影 到 球面 上 





















































假设 天 空 球 (sky sphere) 距 摄像 机 是 无 限 远 的 〈 即 它 的 中 心 位 于 
世界 空间 的 原点 ， 但 半径 无 穷 大 ) ， 这 样 一 来 ， 无 论 摄像 机 移 到 场景 中 
的 哪个 角落 ， 我 们 都 无 法 更 加 接近 或 愈 发 远离 天 空 球面 。 要 实现 这 种 无 
限 远 的 天 窟 ， 可 以 在 世界 空间 里 简单 地 将 天 空 球 的 中 心 置 于 摄像 机 上 ， 
使 它 总 是 以 摄像 机 为 中 心 。 由 于 天 空 球 会 随 着 摄像 机 而 移动 ， 所 以 摄像 
机 并 不 会 更 接近 于 球面 。 若 非 如 此 ， 在 将 摄像 机 移 近 天 空 表面 的 时 候 ， 








整个 戏法 必然 会 被 拆 穿 ， 因 为 我 们 这 里 所 用 的 模拟 天 空 的 把 戏 很 容易 被 
用 户 识破 。 





实现 天 穹 效 果 的 着 色 器 文件 如 下 : 





VB Bhd tnt dt dt tht bt bt th eh 


// Sky .hls1l 的 作者 为 Frank Luna (C) 2615 版 权 所 有 


V0 Bh td td dd ts ed te en ne et he 























// 包含 公用 的 HLSL 代 码 


#include "Common.hlsl" 


struct VertexIn 


{ 
float3 PosL : POSITION; 


float3 NormalL : NORMAL; 
float2 TexC : TEXCOORD; 
}; 


struct VertexOut 


{ 
float4 PosH : SV_POSITION; 
float3 PosL : POSITION; 


}; 


VertexOut VS(VertexIn vin) 
{ 


VertexOut vout; 


// 用 局 部 顶点 的 位 置 作为 立方 体 图 的 伍 找 向 量 


vout.PosL = vin.PostL; 
































// 把 顶点 变换 到 世界 空间 
float4 posW = mul(float4(vin.PosL, 1.6f), gWorld); 








// 总 是 以 摄像 机 作为 天 空 球 的 中 心 
posW.xyz += 8gEYyePosW; 








// 设置 z = w， 从 而 使 z/w = 1《〈 即 令 球面 总 是 位 于 远 平面 ) 


vout .PosH = mul(posNW，gViewProj) .xyww; 

















return vout; 


} 


float4 PS(VertexOut pin) : SV_Target 


{ 


return gCubeMap.Sample(gsamLinearWrap, pin.PosL); 


} 





泻 染 天 空 的 着 色 器 程序 与 绘制 普通 物体 的 着 色 器 程序 
(Default.hls1) 有 着 明显 的 区 别 。 但 是 它们 所 用 的 根 签名 是 相同 的 ， 因 
此 也 就 不 必 在 绘制 的 过 程 中 改变 根 签 名 了 。 由 于 Default.hlsl 和 Sky.hlsl 所 
共用 的 代码 部 分 已 经 移入 Common.hlsl 文 件 ， 所 以 它们 的 代码 并 不 存在 
交集 。 为 便于 读者 参考 ， 这 里 给 出 Common.hlsl 文 件 的 代码: 





本 


米 米 炒米 


// Common.hls1l 的 作者 为 Frank Luna (C) 2615 版 权 所 有 


Bist ta tt dh 





米 米 炒米 


// 光源 数量 的 默认 值 
#ifndef NUM_DIR_LIGHTS 

#define NUM DIR LIGHTS 3 
#endif 





#ifndef NUM POINT_ LIGHTS 
#define NUM POINT_ LIGHTS 6 
#endif 


#ifndef NUM SPOT_LIGHTS 
#define NUM SPOT_LIGHTS 6 
#endif 





// 包含 光照 所 需 的 结构 体 与 函数 
#include "LightingUtil.hlsl" 
// 每 种 材质 所 用 到 的 各 种 常量 数据 
struct MaterialData 
{ 
float4 DiffuseAlbedo; 
float3 FresnelRe; 
float Roughness; 
float4x4 MatTransform; 
uint DiffuseMapIndex; 
uint ”MatPado 
uint MatPad1; 
uint MatPpad2; 








}; 


TextureCube gCubeMap : register(t0); 























// 仅 着 色 器 模型 5.1+ 才 支持 的 纹理 数组 。 与 Texture2DArray 不 同 的 是 ， 此 数组 可 以 由 大 小 
不 一 、 格 式 

// 各 异 的 纹理 组 成 。 因 此 ， 这 使 它 比 普 通 的 纹理 数组 也 更 为 灵活 

Texture2D gDiffuseMap[4] : register(t1); 



































































































































各 此 结构 化 缓冲 区 置 于 space1 中 ， 以 使 纹理 数组 不 会 与 这 些 资源 相 重 登 。 而 纹理 数组 则 




















J 吕 
// 存 器 t6，t1，...，t3 中 的 space@ 
StructuredBuffer<MaterialData> gMaterialData : register(t0, spacel); 





SamplerState gsampointWrap : register(sQ); 
SamplerState gsamPointClamp : register(s1); 
SamplerState gsamLinearWrap : register(s2); 
SamplerState gsamLinearClamp : register(s3); 


SamplerState gsamAnisotropicWrap : register(s4); 
SamplerState gsamAnisotropicClamp : register(s5); 


// 每 一 帧 中 所 用 到 的 各 种 常量 数据 
cbuffer cbPerObject : register(b6) 
{ 

float4x4 gWorld; 

float4x4 gTexTransform; 

uint gMaterialIndex; 

uint gObjPado@; 

uint gObjPad1; 

uint gObjPad2; 
}; 


// 绘制 过 程 中 所 用 到 的 杂项 常量 数据 
cbuffer cbPass : register(b1) 
{ 

float4x4 gView; 

float4x4 gInvView; 

float4x4 gProj; 

float4x4 gInvProj; 

float4x4 gViewProj; 

float4x4 gInvViewProj; 

float3 8gEyePosW; 

float cbPerObjectPad1; 

float2 gRenderTargetSize; 

float2 gInvRenderTargetSize; 

float gNearz; 

float gFarz; 














float gTotalTime; 
float gDeltaTime; 
float4 gAmbientLight; 


// 对 于 每 个 以 MaxLights 为 光源 数量 最 大 值 的 对 象 而 言 ， 索 引 [86，NUM_DIR_LIGHTS] 表 
示 的 是 

// 方向 光 光 源 ， 索 引 [NUM_DIR_LIGHTS，NUM_DIR_LIGHTS+NUM_POINT_LIGHTS) 表 示 的 
是 点 光源 ， 索 引 [NUM_DIR_ 

// LIGHTS+NUM_POINT_LIGHTS，NUM_DIR_LIGHTS+NUM_POINT_LIGHT+NUM_SPOT_LIGH 
TS) 表 

// 示 的 是 聚光灯 光源 

Light gLights[MaxLights]; 


2 





早期 的 应 用 程序 总 是 要 先 绘制 天 空 ， 再 用 它 作 为 蔡 代 品 去 清理 〈 填 
写 ) 泻 染 目标 以 及 深度 /模板 绥 冲 区 。 但 是 ,，“ATI Radeon HD 2000 
Programming Guide”(ATI Radeon HD 2000 编 程 指南 ) 现在 并 不 建议 用 
户 按 此 方式 进行 处 理 : 首先 ， 要 使 内 部 硬件 得 到 更 深层 次 的 优化 而 表现 
得 更 为 出 色 ， 需 要 显 式 地 清理 深度 /模板 缓冲 区 。 这 种 使 用 情景 与 泻 染 
目标 比较 相似 。 其 次 ， 天 衬 的 大 部 分 区 域 会 被 建筑 物 或 地 形 这 样 的 其 他 
几何 体 遮 挡住。 因此 ， 若 率先 绘制 天 空 ， 则 将 会 把 许多 资源 浪费 在 无 效 
像素 的 绘制 上 一 一 这 些 像素 将 被 后 续 所 绘制 的 、 离 摄像 机 更 近 的 物体 所 
遮蔽 。 总 之 ， 建 议 读者 对 缓冲 区 进行 手动 清理 ， 并 把 绘制 天 空 的 工作 放 
在 最 后 。 








绘制 天 空 需要 使 用 与 众 不 同 的 着 色 器 程序 ， 继 而 也 就 会 用 到 新 的 


PSO《〈 流 水 线 状态 对 象 ) 。 因 此 ， 我 们 在 绘制 代码 中 把 天 空 作为 独立 的 
层 进行 泻 染 : 


// 绘制 不 透明 的 泻 染 项 

mCommandList->SetPpipelineState(mpSOs["opaque"].Get()); 

DrawRenderItems(mCommandList.Get(), mRitemLayer[(int) 
RenderLayer: :Opaque]); 








绘制 天 空 泻 染 项 
mCommandList->SetPpipelineState(mpSOs["sky"].Get()); 
DrawRenderItems(mCommandList.Get(), mRitemLayer[(int) 

RenderLayer: :Sky]); 








除 此 之 外 ， 泻 染 天 空 还 需要 采用 一 些 不 同 的 泻 染 状态 。 由 于 摄像 机 
位 于 天 空 球 内 ， 在 禁用 背面 剔除 〈 若 将 逆 时 针 绕 序 的 三 角形 定 为 正面 朝 
问 ， 则 可 不 禁用 此 功能 ) 之 余 ， 我 们 还 要 将 深度 比较 函数 改 
为 LESS_EQUAL， 以 令 天 空 球 能 够 顺利 地 通过 深度 测试 : 


D3D12 GRAPHICS PIPELINE STATE DESC skyPsoDesc = opaquePsoDesc ; 





// 摄像 机 位 于 天 空 球 内 ， 所 以 要 关闭 剔除 功能 
skyPsoDesc.RasterizerState.CullMode = D3D12_CULL_MODE_NONE ; 




















// 确认 深度 测试 函数 为 LESS_EQUAL 而 非 仅 为 LESSs。 和 否则 的 话 ， 如 果 深 度 缓冲 区 中 的 数据 都 
被 清理 为 1， 

// 则 归 一 化 深度 值 为 z = 1 (NDC， 用 规格 化 设备 坐标 所 表示 ) 的 深度 项 将 在 深度 测试 中 失败 
skyPsoDesc.Depthstencilstate.DepthFunc = D3D12 COMPARISON FUNC_LESS EQUAL; 
skyPsoDesc.pRootSignature = mRootSignature.Get(); 

skyPsoDesc.VS = 


{ 
































reinterpret cast<BYTE*>(mShaders["skyVS"]->GetBufferpPointer()), 
mShaders["skyVS"]->GetBufferSize() 

}; 

skyPsoDesc.PS = 

{ 


reinterpret cast<BYTE*>(mShaders["skyPS"]->GetBufferpPointer()), 
mShaders["skyPS"]->GetBufferSize() 


}; 
ThrowIfFailed(md3dDevice->CreateGraphicsPipelinestate( 
&skyPsoDesc, IID PPV_ARGS(&mpPSOs["sky"]))); 





18.4 模拟 反射 


在 第 8 章 中 ， 我 们 学 习 了 镜面 高 光 的 实现 原理 : 光源 发 出 的 光照 时 
在 物体 表面 《界面 ) 上 ， 并 基于 菲 涅 耳 效 应 与 表面 的 粗糙 度 反 射 到 观察 
者 的 眼中 。 但 是 ， 照 射 到 物体 表面 “界面 ) 上 的 光 并 非 仅 从 光源 传 来 的 
直射 兴 ， 而 是 由 于 散射 与 反弹 的 原因 从 各 个 方向 照射 而 来 “混合 区”。 事 
我 们 也 已 将 环境 光 项 加 入 光照 方程 之 中 ， 从 而 模拟 间接 漫 反 射 沦 
照 。 在 本 节 中 ， 我 们 将 展示 如 何 运用 环境 图 去 模拟 来 自 周 围 环境 的 镜面 
反射 (specular reflection ) 。 通 过 镜面 反射 ， E 够 观察 到 基于 菲 
涅 耳 效 应 而 从 物体 表面 〈 界 面 ) 反射 来 的 光 。 还 有 一 个 相关 的 高 级 
主题 ， 但 在 本 书 中 不 会 加 以 讨论 ， 这 也 是 一 种 通过 立方 体 图 计算 来 自 周 
围 环 境 漫 反 射 光 的 方法 〈 读 者 可 以 参考 《GPU Gems 2》 中 的 Chapter 10. 


Real-Time Computation of Dynamic Irradiance Environment Map) 。 





当 我 们 为 构建 环境 图 而 关于 点 O 演 染 场景 时 ， 实 则 是 在 点 DO 处 记录 
来 自 四 面 八方 的 光照 数据 。 换 句 话 说， 环境 图 存储 的 是 从 各 个 方向 照射 
到 点 2 处 的 光照 值 ， 因 此 我 们 可 以 把 环境 图 上 的 每 个 纹 素 都 看 作 一 个 光 
源 。 通 过 这 些 数据 便 可 以 近似 地 计算 出 来 自 周围 环境 光 的 镜面 反射 情 
况 。 为 加 深 理 解 ， 可 参阅 图 18.5。 来 自 入射 方 向 TI 的 环境 光 ， 根 据 菲 涅 
耳 效应 经 界面 反射 ， 以 方向 " = 五 一 P 进 入 观察 者 的 眼中 。 WA 
7 一 reflect( 一 ;7m) 对 环境 立方 体 图 进行 采样 以 获取 环境 光 。 这 一 系列 设 定 
ai 
的 周围 环境 。 
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图 18.5 图 中 的 点 也是 观察 点 ， 奴 是 点 忆 处 的 表面 法 线 。 通 过 得 找 问 量 7 对 立方 体 图 进行 采样 ， 
即 可 获得 存 有 从 以 方向 反映 入 观察 者 眼中 光线 数据 的 纹 素 








计算 每 个 像素 的 反射 向 量 并 用 它 来 对 环境 图 进行 采样 


const float shininess = 1.6f - roughness ; 


// 加 入 镜面 反射 数据 


float3 r = reflect(-toEyeW, pin.NormalW); 

float4 reflectionColor = gCubeMap.Sample(gsamLinearWrap, r); 
float3 fresnelFactor = SchlickFresnel(fresnelR@, pin.NormalW, r); 
litColor.rgb += shininess * fresnelFactor * reflectionColor.rgb; 





由 于 讨论 的 是 与 反射 相关 的 内 容 ， 所 以 目 然 少 不 了 提 及 菲 涅 耳 效 
应 。 它 基于 表面 的 材质 属性 、 光 同 量 《反射 问 量 ) 与 法 线 之 间 的 夹 角 ， 
从 而 确定 从 环境 中 反射 到 观察 者 眼中 的 光量 。 除 此 之 外 ， 我 们 还 要 根据 
材质 的 光泽 度 增 减 反射 值 ， 即 粗糙 材质 反射 的 光量 较 低 ， 即 便 如 此 ， 这 
些 较 小 的 反射 值 仍 不 可 忽略 。 











从 图 18.6 中 可 以 看 出 ， 对 于 平整 的 表面 来 讲 ， 通 过 环境 贴图 实现 的 
反射 效果 并 不 是 很 好 。 


这 是 由 于 反射 癌 量 不 能 给 出 明确 的 位 置 和 关系， 因为 它 不 含有 具体 的 
位 置信 息 ， 而 我 们 需要 的 恰好 束 是 反 冉 光 线 及 其 与 环境 图 的 交点。 光线 
上 共有 位 置 与 方向 这 两 种 属性 ， DO 
图 中 我 们 可 以 看 到 ， 按 道理 来 讲 ，q(4) =P+trq(t) =P +tr 两 束 反 射 光 
线 ， 它 们 分 别 交 于 立方 体 图 的 两 个 不 同 纹 素 ， 因 而 反射 出 的 光线 颜色 应 
当 会 有 差异 。 然 而 ， 由 于 两 束 光 线 采 用 的 是 相同 的 方 癌 癌 量 ">， 而 又 仅 
用 方向 问 量 r 去 实现 立方 体 图 的 纹 素 查 找 工作 ， 因 此 ， 寿 分 别 在 EE 与 BE 
两 点 处 观察 ， 则 会 看 到 映射 到 Pp 与 P 处 的 纹 素 是 相同 的 。 对 于 平滑 的 物 
体 来 讲 ， de ea be 而 相对 于 曲面 物体 而 言 ， 
环境 贴图 的 短 板 将 更 不 易 察 RE 
问 各 弄 。 
































对 此 ， 一 种 解决 方案 是 给 环境 图 关联 一 个 代理 几何 体 (proxy 
0 例如 ， 假 设 有 一 用 于 立方 体 空间 的 环境 图 。 此 时 ， 我 们 就 

给 该 环境 图 关联 一 个 与 其 空间 大 小 近似 的 轴 对 齐 包 围 命 。 图 18.7 所 示 
a 
的 纹 素 更 为 精准 的 查找 向 量 v。 如 果 将 与 立方 体 图 相关 联 的 包围 盒 输 入 
到 着 色 器 中 (例如 通过 常量 缓冲 区 ) ， 束 可 以 在 像素 着 色 器 中 进行 射线 
与 包围 盒 的 相交 检测 ， 据 此 就 能 以 改 展 的 查找 回 量 在 像素 着 色 器 中 对 芯 
方 体 图 进行 采样 。 约 





被 采集 的 纹 素 一 





图 18.6 ” 当 观 察 位 置 分 别 位 于 与 时 ， 对 应 于 平面 上 P 与 户 两 个 不 同 点 的 反射 向 量 











错误 的 纹 素 
查找 方式 正确 的 纹 素 
有 用 查找 方式 
YY v=p+ tor 











图 18.7 ”在 这 种 情况 下 ， 我 们 不 再 用 反射 向 量 7 来 作为 立方 体 图 的 查找 向 量 ， 而 是 用 射线 与 包围 
盒 的 交点 2 三 PD 十 如 7 来 代替 。 注 意 ， 由 于 点 卫 与 包围 盒 代理 几 何 体 的 中 心 位 置 有 关 ， 所 以 上 
述 交 点 可 作为 此 立方 体 图 的 查找 向 量 









































以 下 函数 所 展示 的 是 立方 体 图 查 找 癌 量 的 计算 方法 : 


float3 BoxCubeMapLookup(float3 rayOrigin, float3 unitRayDir, 





float3 boxCenter, float3 boxExtents) 














// 本 实现 基于 《Real-Time Rendering〔 实 时 演 染 ) 》 第 3 版 中 16.7.1 节 所 描述 的 slab 
method[5] 























// 令 射线 的 端点 与 包围 盒 的 中 心 位 置 有 关 
float3 p = rayOrigin - boxCenter; 








// AABB 轴 对 齐 包围 盒 ， 中 第 i 个 slab 射 线 与 平面 相交 检测 的 公式 为 
// 

// tl 
// t2 

















(-dot(n i, p) + h i)/dot(n i, d) 
(-dot(n i, p) - h i)/dot(n i, d) 


(-p_i + h i)/d i 
(-p_i - h i)/d i 





























// 将 所 有 的 slab 都 进行 向 量化 处 理 ， 并 按 射 线 与 平面 的 相交 检测 公式 进行 计算 
float3 t1 = (-p+boxExtents)/unitRayDir; 
float3 t2 = (-p-boxExtents)/unitRayDir; 














// 寻找 每 个 坐标 轴 上 的 最 大 值 。 由 于 我 们 假设 射线 就 位 于 包围 盒 内 ， 因 而 只 希望 求 取 最 大 
的 相交 参数 ， 即 t 值 
float3 tmax = max(t1, t2); 





// 求 取 tmax 所 有 分 量 中 的 最 小 值 


float 七 = min(min(tmax.x, tmax.y), tmax.z); 
































// 由 于 点 p 是 相对 于 包围 盒 的 中 心 位 置 ， 所 以 可 将 它 用 于 计算 立方 体 图 的 查找 向 量 


return p + t*unitRayDir; 

















18.5 ”动态 立方 体 图 


到 目前 为 止 ， 我 们 所 描述 的 都 是 静态 立方 体 图 ， 它 所 存储 的 都 是 预 
先 绘制 好 的 固定 图 像 。 这 种 工作 方式 对 于 茶 些 情景 来 说 是 比较 合理 的 ， 
而 且 开销 较 小 。 但 是 ， 如 果 我 们 希望 在 场景 中 创建 一 些 会 移动 的 动态 角 
色 ， 那 么 这 种 方案 就 不 太 合适 了 。 若 采用 事先 生成 的 立方 体 图 ， 我 们 就 
不 能 用 它 来 捕捉 那些 动态 物体 ， 这 也 就 意味 着 不 能 绘制 出 动态 物体 的 反 
财 镜 像 。 为 了 克服 这 种 限制 ， 束 应 在 运行 时 动态 地 构建 立方 体 图 。 即 我 
们 在 每 一 帧 都 要 将 摄像 机 置 于 场景 之 内 ， 以 它 作 为 立方 体 图 的 原点 ， 沿 
着 坐标 轴 共 6 个 方向 将 场景 分 六 次 逐个 泻 染 到 立方 体 图 的 对 应 面 上 〔 见 
图 18.8) 。 由 于 在 每 一 帧 都 会 重建 立方 体 图 ， 因 此 能 捕捉 到 场景 中 的 动 
态 物体 及 其 动态 的 反射 镜像 〈 见 图 18.9) 。 








注 Note 


动态 地 泻 染 立方 体 图 开销 会 比较 大 ， 因 为 每 一 帧 都 需要 将 场景 绘制 
到 6 个 泻 染 目标 之 中 。 因 此 ， 我 们 要 试 着 将 场景 中 需要 用 到 动态 立方 体 
图 的 地 方 降 到 最 少 。 比 如 ， 我 们 可 以 只 为 突出 场景 中 的 关键 物品 时 才 使 
用 动态 反射 。 而 为 动态 反射 镜像 要 求 不 高 的 次 要 物品 采用 静态 立方 体 
图 。 一 般 来 讲 ， 动 态 立 方 体贴 图 常用 的 是 256 x 256 像 系 这 样 低 分 辨 率 的 
立方 体 图 ， 这 样 做 可 以 减少 要 处 理 的 像素 数量 fil] rate， 像 系 填充 
ES 





图 18.8 ”摄像 机 在 场景 中 的 位 置 O， 正 处 于 所 和 希望 生成 动态 立方 体 图 的 物体 的 中 心 处 。 以 视 场 
角 为 90 的 摄像 机 沿 坐标 轴 的 6 个 方向 将 场景 分 别 泻 染 一 次 ， 以 此 来 截取 整个 周围 环境 的 图 像 








加 :30App ps WWUWY M5pE 55.55335¢ 














图 18.9“Dynamic CubeMap”( 动 态 立 方 体 图 ) 演示 程序 所 呈现 的 动态 反射 效果 。 髓 骨头 绕 场 景 
中 间 的 球体 旋转 ， 它 的 镜像 也 动态 地 反映 在 该 球面 上 。 既 然 我 们 是 自行 绘制 立方 体 图 ， 因 此 也 
就 可 以 将 局 部 物体 的 镜像 泻 染 在 球面 上 ， 如 立柱 、 柱 上 的 球体 以 及 地 面 



































18.5.1 ”动态 立方 体 图 辅助 类 





为 了 便于 动态 地 泻 染 立 方 体 图 ， 我 们 创建 了 以 
下 CubeRenderTarget 类 。 此 类 内 部 封装 了 立方 体 图 的 实 
际 ID3D12Resource 对 象 、 与 该 资源 所 对 应 的 各 种 搬 述 符 ， 以 及 用 于 泡 
染 立 方 体 图 的 的 其 他 有 关 数 据 。 





class CubeRenderTarget 
{ 
public: 
CubeRenderTarget(ID3D12Device* device, 
UINT width, UINT height, 
DXGI FORMAT format); 


CubeRenderTarget(const CubeRenderTarget& rhs)=delete; 
CubeRenderTarget& operator=(const CubeRenderTarget& rhs)=delete; 
~CubeRenderTarget()=default; 


ID3D12Resource* Resource(); 
CD3DX12 GPU _ DESCRIPTOR HANDLE Srv(); 
CD3DX12 CPU DESCRIPTOR HANDLE Rtv(int faceIndex); 


D3D12 VIEWPORT Viewport()const; 
D3D12 RECT ScissorRect()const; 


void BuildDescriptors( 
CD3DX12 CPU_ DESCRIPTOR HANDLE hCpuSrv， 
CD3DX12 GPU_DESCRIPTOR HANDLE hGpuSrv， 
CD3DX12 CPU DESCRIPTOR HANDLE hcCpuRtv[6]); 


void OnResize(UINT newWidth, UINT newHeight); 
private: 


void BuildDescriptors(); 
void BuildResourcel(); 


private: 
ID3D12Device* md3dDevice = nullptr; 


D3D12 VIEWPORT mViewport; 
D3D12 RECT mScissorRect; 


UINT mWidth = 6; 
UINT mHeight = 0; 
DXGI_FORMAT mFormat = DXGI FORMAT R8G8B8A8_UNORM; 


CD3DX12_CPU_DESCRIPTOR HANDLE mhCpusrv; 
CD3DX12_GPU_DESCRIPTOR HANDLE mhGpusrv; 
CD3DX12_ CPU_DESCRIPTOR HANDLE mhCpuRtv[6]; 


Microsoft: :WRL: :Comptr<ID3D1i2Resource> mCubeMap = nullptr; 





18.5.2 ”构建 立方 体 图 资源 





通过 创建 具有 6 个 元 素 的 纹理 数组 (每 个 元 素 都 对 应 着 一 个 立方 体 
图 的 面 ) ， 便 可 以 构建 出 立方 体 图 纹理 。 欲 泻 染 立方 体 图 则 必须 设 
置 D3D12_RESOURCE_FLAG_ALLOW_RENDER_TARGET 标 志 。 我 们 通过 以 
下 方法 来 构建 立方 体 图 资源 。 








void CubeRenderTarget::BuildResource() 
{ 
D3D12 RESOURCE_ DESC texDesc; 
ZeroMemory(&texDesc, sizeof(D3D12 RESOURCE DESC)); 
texDesc.Dimension = D3D12 RESOURCE DIMENSION TEXTURE2D; 
texDesc.Alignment = 0; 
texDesc.Width = mWidth; 
texDesc.Height = mHeight; 
texDesc .DepthOrArraySize = 6; 
texDesc.MipLevels = 1; 
texDesc.Format = mFormat; 
texDesc.SampleDesc.Count = 1; 
texDesc.SampleDesc.Quality = 6; 
texDesc.Layout = D3D12 TEXTURE LAYOUT _ UNKNOWN; 


texDesc.Flags = D3D12_RESOURCE_FLAG_ALLOW_RENDER_TARGET ; 


ThrowIfFailed(md3dDevice->CreateCommittedResource( 
&CD3DX12_HEAP_PROPERTIES(D3D12_HEAP_TYPE_DEFAULT) ， 
D3D12_HEAP_FLAG NONE, 

&texDesc, 

D3D12 RESOURCE STATE_ GENERIC_ READ, 
nullptr, 
IID_PPV_ARGS(&mCubeMap ) ) ) ; 





18.5.3 分 配额 外 的 描述 “| 同 


为 了 演 染 立方 体 图 ， 要 新 添加 6 个 演 染 目标 视 网 ， 使 之 与 立方 
体 图 的 各 个 面 一 一 对 应 。 男 外 ， 还 要 附加 一 个 深度 /模板 缓冲 区 ， 因 此 
我 们 必须 重 写 
(override ) D3DApp: :CreateRtvAndDsvDescriptorHeaps 方 法 来 为 
这 些 额外 的 描述 符 分 配 摘 述 符 堆 。 





void DynamicCubeMapApp: :CreateRtvAndDsvDescriptorHeaps() 


{ 
// 为 立方 体 泻 染 目 标 添加 6 个 RTV( 泻 染 目 标 视图 ) 
D3D12 DESCRIPTOR HEAP_ DESC rtvHeapDesc; 
rtvHeapDesc.NumDescriptors = SwapChainBufferCount + 6; 
rtvHeapDesc.Type = D3D12 DESCRIPTOR HEAP_TYPE_RTV; 
rtvHeapDesc.Flags = D3D12 DESCRIPTOR HEAP FLAG NONE; 
rtvHeapDesc.NodeMask = 
ThrowIfFailed(md3dDevice->CreateDescriptorHeap( 

&rtvHeapDesc, IID PPV_ARGS(mRtvHeap.GetAddressOf()))); 





























// 为 立方 体 泻 染 目 标 新 增 1 个 DSV( 深 度 / 模 板 视图 
D3D12_DESCRIPTOR HEAP_DESC dsvHeapDesc; 
dsvHeapDesc.NumDescriptors = 2; 
dsvHeapDesc.Type = D3D12 DESCRIPTOR HEAP_TYPE_DSYV; 
dsvHeapDesc.Flags = D3D12 DESCRIPTOR_ HEAP_FLAG NONE; 
dsvHeapDesc.NodeMask = 
ThrowIfFailed(md3dDevice->CreateDescriptorHeap( 
&dsvHeapDesc, IID PPV_ARGS(mDsvHeap.GetAddressOf()))); 





YL 








mCubeDSV = CD3DX12_CPU_DESCRIPTOR_HANDLE( 
mDsvHeap->GetCPUDescriptorHandleForHeapStart(), 
1, 
mDsvDescriptorSize); 





除 此 之 外 ， 还 需 新 增 一 个 SRV (着色 器 资源 视图 ) ， 以 便 在 生成 立 
方 体 图 之 后 将 它 绑 定 为 着 色 器 的 输入 数据 。 


描述 符 的 句柄 都 要 传 入 CubeRenderTarget: :BuildDescriptors 
方法 ， 它 会 保存 一 份 句柄 的 副本 并 为 它们 创建 相应 的 视图 。 


一 < 





auto srvCpuStart = mSrvDescriptorHeap->GetCPUDescriptorHandleForHeapStart( 
) ; 

auto srvGpustart = mSrvDescriptorHeap->GetGPUDescriptorHandleForHeapStart( 
) ; 

auto rtvCpuStart = mRtvHeap->GetCPUDescriptorHandleForHeapStart(); 





// 位 列 交 换 链 的 描述 符 之 后 的 立方 体 图 RTV 
int rtvoffset = SwapChainBufferCount; 














CD3DX12_ CPU_DESCRIPTOR HANDLE cubeRtvHandles[6]; 
for(int i = 6; i < 6; ++i) 
cubeRtvHandles[i] = CD3DX12 CPU DESCRIPTOR HANDLE( 
rtvCpuStart, rtvoffset + i, mRtvDescriptorSize); 


mDynamicCubeMap->BuildDescriptors( 
CD3DX12 CPU_DESCRIPTOR HANDLE( 
srvCpuStart, mDynamicTexHeapIndex, mCbvSrvDescriptorSize), 
CD3DX12 GPU_DESCRIPTOR HANDLE( 
srvGpuStart, mDynamicTexHeapIndex, mCbvSrvDescriptorSize), 
cubeRtvHandles); 


void CubeRenderTarget::BuildDescriptors(CD3DX12 CPU_DESCRIPTOR HANDLE hCpu 
Srv， 

CD3DX12_GPU_DESCRIPTOR_HANDLE hGpuSryv, 

CD3DX12_ CPU_DESCRIPTOR HANDLE hCpuRtv[6]) 








{ 
// 保存 对 描述 符 的 引用 
mhCpuSrv = hCpusrv 
mhGpuSrv = hGpusSrv 














for(int i = 6j i < 6; ++i) 
mhCpuRtv[i] = hCpuRtv[i]; 








// 创建 描述 符 











BuildDescriptors(); 
} 





18.5.4 ”构建 描述 和 从 


在 上 一 节 中 ， 我 们 为 描述 符 分 配 了 相应 的 描述 符 扒 空间 ， 并 缓存 了 
对 描述 符 的 引用 。 但 是 到 目前 为 止 ， 仍 没有 为 任何 资源 真正 地 创建 描述 
人 符 。 因 此 ， 现 在 的 当务之急 是 为 立方 体 图 资源 创建 一 个 SRV， 以 便 能 够 
在 像素 着 色 器 中 对 它 进 行 采 样 。 另 外 ， 还 需要 为 立方 体 图 纹理 数组 中 的 
每 个 元 素 创建 一 个 演 染 目标 视图 ， 借 此 对 立方 体 图 的 每 个 面 依次 进行 给 
制 。 创 建 所 需 视图 的 方法 如 下 。 











void CubeRenderTarget::BuildDescriptors() 
{ 
D3D12_ SHADER RESOURCE VIEW DESC srvDesc = {}; 
srvDesc.Shader4ComponentMapping = D3D12 DEFAULT_ SHADER 4 COMPONENT MAPPI 
NG ; 
srvDesc.Format = mFormat; 
srvDesc.ViewDimension = D3D12_ SRV_DIMENSION TEXTURECUBE; 
srvDesc.TextureCube.MostDetailedMip = 6; 
srvDesc.TextureCube.MipLevels = 1; 
srvDesc.TextureCube.ResourceMinLODClamp = 8.6f; 


// 为 整个 立方 体 图 资源 创建 SRV 
md3dDevice->CreateShaderResourceView(mCubeMap.Get(), &srvDesc, 
mhCpuSrv); 





// 为 每 个 立方 体面 创建 RTV 

for(int i = 6; i < 6; ++i) 

{ 
D3D12 RENDER TARGET VIEW DESC rtvDesc; 
rtvDesc.ViewDimension = D3D12 RTV_DIMENSION TEXTURE2DARRAY; 
rtvDesc.Format = mFormat; 
rtvDesc.Texture2DArray.MipSlice = 6; 





rtvDesc.Texture2DArray.PlaneSlice 


// 表示 现 要 为 第 i 


rtvDesc.Texture2DArray.FirstArraysSlice 


// 仪 为 数组 中 的 每 一 个 元 素 创建 一 个 视图 


0; 





个 元 素 创 建 演 染 目标 视图 





= 1， 





rtvDesc.Texture2DArray.ArraySize = 1; 


// 为 立方 体 图 的 鳞 








和 i 个 面 创建 RTV 


md3dDevice->CreateRenderTargetView(mCubeMap.Get(), &rtvDesc, 


mhCpuRtv[i]); 





18.5.5 ”构建 深 友 缓冲 区 


此 ， 要 演 染 立方 体 图 的 诺 面 ， 我 们 就 


一 般 来 讲 ， 立 方 体 图 的 各 面 与 主 后 台 缓 冲 区 的 分 状 率 是 不 同 的 。 因 


需要 玉 用 与 立方 体 图 面 分 状 率 大 小 


相 匹 配 的 深度 缓冲 区 。 考 虑 到 每 次 只 泻 染 立方 体 的 一 个 面 ， 所 以 立方 体 
图 的 泻 染 工作 仪 需 1 个 深度 缓冲 区 即 可 。 我 们 可 以 通过 下 列 代 码 来 构建 
新 添 的 深度 缓冲 区 及 其 DSV。 








void DynamicCubeMapApp: :BuildCubeDepthStencil() 
{ 





// 创建 深度 /模板 缓冲 区 及 其 视图 


D3D12 RESOURCE_DE 
depthStencilDesc. 
depthStencilDesc 
depthStencilDesc 
depthStencilDesc 
depthStencilDesc 
depthStencilDesc. 
depthStencilDesc. 
depthStencilDesc. 
depthStencilDesc. 
depthStencilDesc. 
depthStencilDesc. 


D3D12_CLEAR_VALUE 


SC depthSstencilDesc ; 
Dimension = D3D12 RESOURCE DIMENSION TEXTURE2D; 


.Alignment = 6; 
.Width = CubeMapSize; 
.Height 
.DepthOrArraySize 


CubeMapSize; 
1 


MipLevels = 1; 

Format mDepthStencilFormat; 

SampleDesc.Count 13 

SampleDesc.Quality = 6; 

Layout = D3D12 TEXTURE_ LAYOUT UNKNOWN; 

Flags = D3D12 RESOURCE FLAG ALLOW DEPTH_ STENCIL; 


optClear:; 


optClear.Format = mDepthStencilFormat; 
optClear.DepthStencil.Depth = 1.6f; 
optClear.DepthStencil.Stencil = 0; 
ThrowIfFailed(md3dDevice->CreateCommittedResource( 
&CD3DX12_HEAP_PROPERTIES(D3D12 HEAP_TYPE_DEFAULT) ， 
D3D12_HEAP_FLAG_ NONE, 
&depthStencilDesc, 
D3D12 RESOURCE STATE_ COMMON, 
&optClear， 
IID_PPV_ARGS(mCubeDepthStencilBuffer.GetAddressof() ) ) ); 











// 以 资源 自 映 的 格式 为 整个 资源 的 mip 8 层级 创建 描述 符 
md3dDevice->CreateDepthstencilView( 
mCubeDepthStencilBuffer.Get(), nullptr, mCubeDSV); 


// 将 资源 从 初始 状态 转换 为 深度 缓冲 区 
mCommandList->ResourceBarrier(1, 
&CD3DX12 RESOURCE BARRIER: :Transition( 
mCubeDepthStencilBuffer .Get(), 
D3D12 RESOURCE STATE COMMON, 
D3D12_RESOURCE_ STATE_DEPTH WRITE)); 





18.5.6 ”立方 体 图 的 视 口 与 裁剪 矩形 


由 于 立方 体 图 各 面 与 主 后 人 台 绥 冲 区 的 分 辨 率 不 一 致 ， 因 此 需要 定义 
一 个 新 的 视 口 以 及 裁 攀 矩形 来 “对 准 哲 摄 * 立 方 体 图 面 。 








CubeRenderTarget: :CubeRenderTarget(ID3D12Device* device, 
UINT width, UINT height, 
DXGI_FORMAT format) 


md3dDevice = device; 
mWidth = width; 
mHeight = height; 


mFormat = format; 


mViewport = { 868.6f, 606.6f, (float)width, (float)height, 6.6f, 1.6f }; 
mScissorRect = { 06, 0, width, height }; 


BuildResource( ) ; 


} 


D3D12 VIEWPORT CubeRenderTarget::Viewport()const 


{ 
return mViewport; 
} 
D3D12_ RECT CubeRenderTarget::ScissorRect()const 
{ 
return mScissorRect; 
} 





18.5.7 设置 立方 体 图 摄像 机 


前 文 兽 讲 到 ， 生 成 立方 体 图 的 方法 是 ， 把 视 场 角 为 90” (垂直 方向 和 
水 平方 回 的 视 场 角 都 是 90"〉 的 摄像 机 架设 在 场景 中 茶 物 体 O 的 中 心 点 。 
再 使 摄像 机 分 别 对 准 r、 人 :三 轴 的 正 、 负 共 6 个 方向 ， 并 以 这 6 种 视角 
来 摄取 场景 图 片 〈 除 了 物体 D) 。 为 了 便于 此 流程 的 实现 ， 我 们 以 给 定 
的 位 置 (7,y,?) 为 中 心 生 成 了 6 台 援 像 机 ， 它 们 分 别 负责 立方 体 图 中 一 个 
面 上 的 图 像 截 取 工 作 。 





Camera mCubeMapCameral[6]; 
void DynamicCubeMapApp: :BuildCubeFaceCamera(float x, float y, float z) 


{ 
// 生成 指定 位 置 处 的 立方 体 图 





XMFLOAT3 center(x, y, 2z); 
XMFLOAT3 worldup(8.6f，1.6f，6.6f); 





// 沿 着 每 一 个 坐标 轴 方 向 进行 观察 

XMFLOAT3 targets[6] = 

{ 
XMFLOAT3(x + 1.6f, y, z), // +X 
XMFLOAT3(x - 1.6f, y, z), // -xX 
XMFLOAT3(x, y + 1.6f, z), // +Y 
XMFLOAT3(x, y - 1.6f, z), // -Y 
XMFLOAT3(x, y, z + 1.6f), // +Z 
XMFLOAT3(x, y, z - 1.6f) // -Zz 

}; 











// 除了 +Y/-Y， 其 他 方 同 上 的 上 问 量 均 用 世界 空间 中 的 上 向 量 (6,1,8) 表 示 。 在 +Y/-Y 这 
个 方 庙 > 
两 个 方向 上 ， 我 

//_ 们 分 别 要 沿 着 +Y 或 -Y 进 行 观察 ， 因 此 便 需 要 用 一 个 与 众 不 同 的 “< 上” 癌 量 

XMFLOAT3 ups[6] = 

{ 
XMFLOAT3(6.6f， 
XMFLOAT3(6.6f， 
XMFLOAT3(6.6f， 
XMFLOAT3(6.6f， 
XMFLOAT3(6.6f， 
XMFLOAT3(86.6f， 

}; 





























.6f, 60.6f), // +X 
.6f, 6.6f), // -Xx 
.of，-1.6f)， // +Y 
.6f, +1.6f), // -Y 
.6f, 6.6f), // +Z 
.of，6.6f) // -2Z 


PPAOOEOPP 


for(int i = 6; i < 6; ++i) 


mCubeMapCamera[i].LookAt(center, targets[i], ups[i]); 
mCubeMapCamera[i].SetLens(8.5f*XM PI, 1.6f, 960.1f, 16606.6f); 
mCubeMapCamera[i].UpdateViewMatrix(); 
} 
} 





由 于 泻 染 立方 体 的 不 同 面 要 动用 不 同 的 摄像 机 ， 因 此 每 个 立方 体面 
都 需要 拥有 一 组 它 自己 独 有 的 PassConstants〔 演 染 过 程 常量 ) 。 好 在 
这 项 工作 并 不 复杂 ， 只 要 在 创建 帧 资源 时 将 PassConstants 的 个 数 再 增 
加 6 个 即 可 。 








void DynamicCubeMapApp: :BuildFrameResources() 


{ 


for(int i = 6; i «< gNumFrameResources; ++i) 


{ 


mFrameResources.push back(std::make unique<FrameResource>(md3dDevice.G 
et()， 


7，(UINT)mA1L1LRitems .size()，(UINT)mMaterials.size())); 





元 素 0 对 应 于 主演 染 过 程 ， 而 元 系 1~6 则 与 立方 体 诸 面 相对 应 。 





为 每 一 个 立方 体 图 面 设置 常量 数据 的 方法 如 下 : 


void DynamicCubeMapApp: :UpdateCubeMapFacePassCBs( ) 
{ 

for(int i = 6; i < 6; ++i) 

{ 


PassConstants cubeFacePassCB = mMainpassCB; 


XMMATRIX view = mCubeMapCamera[i].GetView(); 
XMMATRIX proj = mCubeMapCameral[li].GetProj(); 


XMMATRIX viewProj = XMMatrixMultiply(view, proj); 

XMMATRIX invView = XMMatrixInverse(&XMMatrixDeterminant(view), 

view); 

XMMATRIX invProj = XMMatrixInverse(&XMMatrixDeterminant(proj), 

proj); 

XMMATRIX invViewProj = XMMatrixInverse(&XMMatrixDeterminant(viewProj), 
viewProj); 


XMStoreFloat4x4(&cubeFacePpassCB.View, XMMatrixTranspose(view)); 
XMStoreFloat4x4(&cubeFacePpassCB.InvView, 
XMMatrixTranspose(invView)); 
XMStoreFloat4x4(&cubeFacePassCB.Proj, XMMatrixTranspose(proj)); 
XMStoreFloat4x4(&cubeFacePassCB.InvProj, 
XMMatrixTranspose(invProj)); 
XMStoreFloat4x4(&cubeFacePassCB .ViewProj, 
XMMatrixTranspose(viewProj)); 
XMStoreFloat4x4(&cubeFacePpassCB.InvViewProj, XMMatrixTranspose(invView 
Proj)); 

cubeFacePassCB.EyePosW = mCubeMapCamera[i].GetPosition3f(); 
cubeFacePassCB.RenderTargetSize = 

XMFLOAT2((float)CubeMapSize, (float)CubeMapSize); 
cubeFacePassCB.InvRenderTargetSize = 

XMFLOAT2(1.6f / CubeMapSize, 1.6f / CubeMapSize); 


auto currPassCB = mCurrFrameResource->PassCB.get(); 


// 元 素 1~6 中 存储 的 是 立方 体 图 (6 个 面 ) 演 染 过 程 中 所 用 的 常量 缓冲 区 


currPpassCB->CopyData(1 + i, cubeFacepassCB); 
































18.5.8 ”对 立方 体 图 进行 绘制 


针对 此 演示 程序 ， 我 们 设 定 了 3 个 泻 染 层 : 


enum class RenderLayer : int 


{ 
Opaque = 0， 


OpaqueDynamicReflectors, 
Sky, 
Count 





OpaqueDynamicReflectors 演 染 层 含有 图 18.9 所 示 的 通过 动态 立 
方 体 图 技术 来 反射 局 部 动态 物体 的 中 心 球体 。 首 先 将 场景 绘制 到 立方 体 
图 的 每 个 面 上 ， 但 是 不 包括 中 心 球体 上 自身。 这 也 束 意 味 着 只 需 把 不 透明 
物体 层 以 及 天 空 层 泻 染 到 立方 体 图 即 可 。 














void DynamicCubeMapApp: :DrawSceneToCubeMap() 

{ 
mCommandList->RSSetViewports(1, &mDynamicCubeMap->Viewport()); 
mCommandList->RSSetScissorRects(1, &mDynamicCubeMap->ScissorRect()); 





// 将 立方 体 图 资源 转换 为 RENDER_TARGET 〈 演 染 目标 ) 
mCommandList->ResourceBarrier(1， 
&CD3DX12_RESOURCE_BARRIER: :Transition( 
mDynamicCubeMap->Resource( )， 
D3D12_RESOURCE_STATE_GENERIC_READ， 
D3D12 RESOURCE STATE RENDER TARGET)); 





UINT passCBByteSize = d3dUtil::CalcConstantBufferByteSize(sizeof(PassCo 
nstants) ) ; 


// 针对 立方 体 图 的 每 个 面 …. 
for(int i = 6; i «< 6; ++i) 


{ 




















// 清理 后 台 绥 冲 区 以 及 深度 缓冲 区 
mCommandList->ClearRenderTargetView( 

mDynamicCubeMap->Rtv(i), Colors::LightSteelBlue, 68, nullptr); 
mCommandList->ClearDepthStencilView(mCubeDSV, 

D3D12 CLEAR FLAG DEPTH | D3D12 CLEAR FLAG STENCIL, 

1.6f, 0, 060, nullptr); 























// 指定 将 要 渲染 的 缓冲 区 
mCommandList->OMSetRenderTargets(1, &mDynamicCubeMap->Rtv(i), 
true, &mCubeDSV); 





























// 为 当前 的 立方 体 图 面 绑 定 对 应 的 泻 染 过 程 常量 缓冲 区 ， 这 样 一 来 ， 我 们 就 可 以 使 用 正 























确 的 视图 矩阵 以 


} 


// 
mC 








// 及 投影 矩阵 来 绘制 此 立方 体 图 
auto passCB = mCurrFrameResource->PassCB->Resource() ; 
D3D12_GPU_VIRTUAL ADDRESS passCBAddress = 
passCB->GetGPUVirtualAddress() + (1+i)*passCBByteSize; 
mCommandList->SetGraphicsRootConstantBufferView(1, passCBAddress); 








DrawRenderItems(mCommandList.Get(), mRitemLayer[(int) 
RenderLayer: :Opaque]); 


mCommandList->SetPpipelineState(mpSOs["sky"].Get()); 
DrawRenderItems(mCommandList.Get(), mRitemLayer[(int) 
RenderLayer: :Sky]); 


mCommandList->SetPpipelineState(mpSOs["opaque"].Get()); 




















将 立方 体 图 资源 转换 回 GENERIC_READ 状 态 ， 以 便 在 着 色 器 中 读 取 纹理 数据 
ommandList->ResourceBarrier(1, 

&CD3DX12 RESOURCE BARRIER: :Transition( 
mDynamicCubeMap->Resource()， 
D3D12_RESOURCE_STATE_RENDER_TARGET ， 

D3D12 RESOURCE STATE GENERIC READ)); 














绘制 





Draw 





问 立 方 体 图 泻 染 场 景 之 后 ， 我 们 还 要 像 以 前 那样 设置 主演 染 目 标 并 
场景 ， 但 是 别 忘 了 还 要 将 动态 立方 体 图 绘制 到 中 心 球体 上 。 


SceneToCubeMap(); 


// 设置 主演 染 目标 


mCom 
mCom 





mandList->RSSetViewports(1, &mScreenViewport); 
mandList->RSSetScissorRects(1, &mScissorRect); 





// 根据 资源 的 用 处 而 转换 其 状态 


mCom 
&C 
Cu 
D3 
D3 





mandList->ResourceBarrier(1, 

D3DX12 RESOURCE BARRIER: :Transition( 
rrentBackBuffer(), 

D12 RESOURCE _ STATE_ PRESENT, 

D12 RESOURCE STATE RENDER TARGET)); 











x 





// 潜 


4 理 后 台 绥 冲 区 与 深度 绥 冲 区 




















mCommandList->ClearRenderTargetView(CurrentBackBufferView()， 
Colors::LightSsteelBlue，6，nullptr); 
mCommandList->ClearDepthStencilView( 
DepthStencilView(),， 
D3D12 CLEAR FLAG DEPTH | D3D12 CLEAR FLAG STENCIL, 
1.6f, 0, 60, nullptr); 





// 指定 将 要 渲染 的 缓冲 区 
mCommandList->OMSetRenderTargets(1, 
&CurrentBackBufferView(), true, &DepthStencilView()); 


auto passCB = mCurrFrameResource->PassCB->Resourcel(); 
mCommandList->SetGraphicsRootConstantBufferView(1, 
passCB->GetGPUVirtualAddress()); 


// 为 动态 反射 层 0paqueDynamicReflectors 使 用 动态 立方 体 图 
CD3DX12_GPU_DESCRIPTOR_HANDLE dynamicTexDescriptor( 
mSrvDescriptorHeap->GetGPUDescriptorHandleForHeapStart()); 
dynamicTexDescriptor.0Offset(mSkyTexHeapIndex + 1, 
mCbvSrvDescriptorSize); 
mCommandList->SetGraphicsRootDescriptorTable(3, dynamicTexDescriptor); 


DrawRenderItems(mCommandList .Get(), 
mRitemLayer[(int)RenderLayer::0OpaqueDynamicReflectors |); 





// 为 其 他 物体 〈 包 括 天 空 ) 使 用 静态 “背景 ”立方 体 图 


mCommandList->SetGraphicsRootDescriptorTable(3, skyTexDescriptor); 








DrawRenderItems(mCommandList.Get(), mRitemLayer[(int) 
RenderLayer: :Opaque]); 


mCommandList->SetPpipelineState(mpSOs["sky"].Get()); 
DrawRenderItems(mCommandList.Get(), mRitemLayer[(int) 
RenderLayer: :Sky]); 





// 根据 资源 的 用 途 而 转换 其 状态 
mCommandList->ResourceBarrier(1, 
&CD3DX12 RESOURCE BARRIER: :Transition( 
CurrentBackBuffer(), 
D3D12 RESOURCE STATE RENDER _ TARGET, 
D3D12_ RESOURCE_ STATE_ PRESENT)); 








18.6 用 几何 着 色 器 绘制 动态 立方 体 图 


在 上 一 节 中 ， 我 们 (以 不 同 的 视角 ) 将 场景 反复 绘制 6 次 ， 并 依次 
演 染 到 每 个 立方 体 图 的 面 上 ， 以 此 来 生成 立方 体 图 。 绘 制 调用 是 有 开销 
的 ， 所 以 应 尽量 减少 调用 次 数 。Direct3D 10 有 一 名 为 “CubeMapGS” 的 示 
例 ， 它 通过 几何 着 色 器 仅 需 绘制 一 遍 场景 即 可 演 染 好 一 幅 立 方 体 图 。 在 
本 节 中 ， 我 们 的 主题 便 是 讲解 这 一 示例 的 工作 方式 。 注 意 ， 尽 管 这 里 演 
示 的 是 Direct3D 10 版 本 的 相关 代码 ， 但 是 其 中 所 用 的 策略 在 Direct3D 12 
中 依然 适用 ， 而 且 代 码 移植 起 来 也 比较 容易 。 


首先 ， 该 例 程 为 整个 纹理 数组 (而 不 是 按 每 个 面 都 单独 分 开 的 纹 
理 ) 创建 了 一 个 演 染 目标 视图 。 





// 创建 6 个 面 的 整体 演 染 目标 视图 

D3D16_RENDER_TARGET_VIEW_DESC DescRT; 

DescRT .Format = dstex.Format; 

DescRT.ViewDimension = D3D18 RTV_DIMENSION TEXTURE2DARRAY; 








DescRT.Texture2DArray .FirstArraySlice = 0; 
DescRT.Texture2DArray .ArraySize = 6; 
DescRT.Texture2DArray.MipSlice = 6; 

V_RETURN( pd3dDevice->CreateRenderTargetView( 
g_pEnvMap, &DescRT, &g_pEnvMapRTV ) ); 





要 运用 这 种 绘制 方式 ， 还 需要 一 个 由 6 个 深度 缓冲 区 构成 的 “立方 体 
图 ”《 即 每 个 深度 缓冲 区 都 对 应 于 一 个 面 ) 。 为 整个 深度 缓冲 区 纹理 数 
组 创建 深度 /模板 视图 的 过 程 如 下 。 








// 为 整个 立方 体 创建 深度 /模板 视图 
D3D16_DEPTH_STENCIL_VIEW_DESC DescDs; 

DescDS.Format = DXGI_FORMAT_D32_FLOAT; 

DescDS .ViewDimension = D3D16_DSV_DIMENSION_TEXTURE2DARRAY ; 


DescDS.Texture2DArray .FirstArraySlice = 0; 
DescDS.Texture2DArray .ArraySize = 6; 
DescDS.Texture2DArray.MipSlice = 6; 

V_RETURN( pd3dDevice->CreateDepthStencilView( 
g_pEnvMapDepth, &DescDS, &g pEnvMapDSV ) ); 





接 下 来 将 上 述 演 染 目标 视图 与 深度 /模板 视图 绑 定 到 演 染 流水 线 的 
OS“〈 输 出 合并 ) 阶段 。 


ID3D16RenderTargetView#k aRTViews[ 1 ] = { g_pEnvMapRTV }; 


pd3dDevice->OMSsetRenderTargets(sizeof(aRTViews)/sizeof(aRTViews[6])， 
aRTViews, g_pEnvMapDSV ) 





完成 这 些 工 作 后 ， 我 们 就 已 经 将 泻 染 目标 数组 的 视图 以 及 深度 / 模 
板 缓 冲 区 数组 的 视图 绑 定 至 OM 阶段 ， 随 后 就 将 对 每 个 数组 切片 (array 
slice) 同时 进行 泻 染 。 


至 此 ,场景 已 被 泻 染 1 次 ， 且 6 个 观察 矩阵 所 构成 的 数组 (每 一 个 和 矩 
阵 都 用 于 按 立 方 体 图 面 的 对 应 方向 进行 观察 〉 已 在 常量 缓冲 区 中 就 位 。 
几何 着 色 器 会 将 输入 的 三 角形 复制 6 次 ， 并 依次 赋予 一 个 泻 染 目标 数组 
切片 。 通 过 设置 系统 值 SV_RenderTargetArrayIndex， 我 们 就 能 把 三 
角形 赋予 到 演 染 目标 数组 切片 之 中 。 此 系统 值 是 仅 用 于 设置 几何 着 色 器 
输出 的 整数 索引 值 ， 它 指定 了 图 元 应 当 被 绘制 到 的 泻 染 目标 数组 切片 的 
索引 。 而 且 ， 只 有 当 泻 染 目标 视图 为 数组 资源 时 ， 才 可 用 此 系统 值 。 











struct PS_CUBEMAP_IN 


float4 Pos : SV_POSITION;  // 投影 坐标 

float2 Tex : TEXCOORD6; // 纹理 坐标 

uint RTIndex : SV_RenderTargetArrayIndex; 
}; 





[maxvertexcount(18)] 
void GS CubeMap( triangle GS CUBEMAP_ IN input[3]， 


inout Trianglestream CubeMapStream ) 


{ 
// 针对 每 个 三 角形 .. 
for( int f = 6;f 6; ++f ) 
{ 
// 计算 屏幕 坐标 
PS_CUBEMAP_IN output ; 





// 将 第 f 个 三 角形 赋予 第 f 个 演 染 目标 
output.RTIndex = ff; 








// 针对 三 角形 的 每 个 顶点 .… 
for( int v= 6jVv《3;Vv++) 
{ 
// 把 项 点 变换 到 第 f 个 立方 体面 的 观察 空间 
output.Pos = mul( input[v].Pos, g mViewCM[f] ); 


// 将 顶点 变换 到 齐 次 裁剪 空间 
output .Pos = mul( output.Pos，mProj ) 


output .Tex = input[v].Tex; 
CubeMapStream.Append( output ) 


} 
CubeMapStream.RestartStrip(); 





可 以 看 出 ， 按 照 上 述 方法 ， 仅 需 演 染 一 过 场景 就 能 为 立方 体 图 的 每 
个 面 绘 制 好 相应 的 图 像 ， 而 不 必 再 逐 面 进行 共 6 次 泻 染 。 





注 意 Note Sp 


我 们 在 此 仪 梳理 了 该 示例 的 主要 思路 ， 如 要 了 解 “CubeMapGS” 的 具 
体 细节 ， 可 查阅 此 Direct3D 10 例 程 的 源 代 码 。 


这 个 例 程 所 展示 的 方案 很 有 意思 ， 既 演示 了 多 泻 染 目标 的 同时 绘 
制 ， 又 给 出 了 SV_RenderTargetArrayIndex 系 统 值 的 使 用 方法 。 然 
而 ， 此 方法 并 非 完 美 无 缺 ， 它 暴露 出 的 两 个 缺陷 使 它 失色 不 少 。 


1. 它 使 用 几何 着 色 强 来 输出 大 量 的 数据 。 在 第 12 半 中 我 们 曾 提 到 
过 : 当 几 何 着 色 器 输出 大 量 的 数据 时 ， 它 的 效率 极 低 。 因 此 ， 以 输出 多 
顶点 为 目的 来 使 用 几何 着 色 器 会 对 程序 的 整体 性 能 造成 破坏 。 





2. 在 一 般 的 场景 中 ， 茶 个 三 角形 是 不 会 与 第 二 个 立方 体 图 面相 重 
登 的 (回顾 图 18.8〉 。 因 此 ， 复 制 三 角形 并 将 其 泻 染 至 每 个 立方 体 的 面 
上 极其 浪费 资源 ， 这 是 因为 6 个 面 之 中 有 5 个 面 的 三 角形 需要 被 裁 又 挥 。 
不 可 否认 的 是 ， 我 们 在 本 间 中 所 用 的 例 程 确实 简化 了 将 整个 场景 演 染 至 
每 个 立方 体 图 面 上 的 过 程 。 然 而 在 真实 的 应 用 程序 〈 非 演示 程序 ) 中 ， 
我 们 会 使 用 视 锥 体 剔 除 技术 《 第 16 草 ) ， 仅 将 可 见 的 物体 泻 染 到 特定 的 
立方 体 图 面 之 上 。 而 视 锥 体 吻 除 是 在 物体 层级 中 执行 ， 所 以 几何 体 着 色 
右 并 不 能 实现 此 技术 。 











但 从 为 一 方面 来 说 ， 在 演 染 包围 场景 的 网 格 时 ， 这 种 全 上 略 的 效果 超 
群 。 例 如 ,假设 有 一 动态 的 天 空 模 拟 系 统 ， 基 于 每 天 的 不 同时 段 ， 云 层 
会 对 动 ， 天 空 的 颜色 也 会 发 生 改 变 。 由 于 天 空 时 时 在 变化 ， 我 们 是 不 能 
预先 烘焙 〈prebaked， 指 将 光照 或 反射 等 效果 添加 至 物体 的 纹理 之 上 ， 
以 此 改善 泻 染 性 能 ) 出 立方 体 图 纹理 来 反射 天 空 景象 的 ， 因 此 不 得 不 使 
用 动态 立方 体 图 。 由 于 天 空 网 格 包围 着 整个 场景 ， 也 就 是 说 ， 它 在 立方 
体 图 的 6 个 面 内 都 是 可 见 的 。 因 此 ， 这 种 情况 完全 打破 了 上 面 所 列 第 二 
条 论点 的 束缚 。 此 时 ， 该 几何 着 色 吉 方案 了 能 依靠 将 6 次 绘制 调用 降 为 1 





次 而 占 优 。 当 然 ， 还 要 同时 保证 此 几何 着 色 吉 的 用 法 不 会 严重 破坏 程序 
的 性 能 。 


注意 Note pe 


NVIDIA 公 司 对 Maxwell 架 构 进行 的 最 新 优化 ， 使 几何 着 色 器 向 多 个 
演 染 目标 复制 几何 体 的 操作 不 会 造成 过 大 的 性 能 损失 。 尽 管 写 作 本 书 之 
时 ， 这 些 特性 还 没有 在 Direct3D 12 中 实现 ， 但 相信 在 不 久 的 将 来 ， 
Direct3D 能 够 为 此 而 进行 更 新 。 





187 了 7- 水 笃 


1. 立方 体 图 由 6 个 纹理 组 成 ， 我 们 把 它们 分 别 视 作 立 方 体 的 每 一 个 
面 。 在 Direct3D 12 中 ， 可 以 通过 ID3D12Resource 接 口 将 立方 体 图 表示 
为 具有 6 个 元 素 的 纹理 数组 。 而 在 HLSL 中 ， 立 方 体 图 由 TextureCube 类 
型 表示 。 我 们 使 用 3D 纹 理 坐 标 来 指定 立方 体 图 上 的 纹 素 ， 它 定义 了 一 
个 以 立方 体 图 中 心 为 起 点 的 3D 查 找 同 量 v。 该 同 量 与 立方 体 图 相交 处 的 
纹 素 即 为 v 的 3D 华 标 所 对 应 的 纹 素 。 











2. 环境 图 即 为 在 茶点 处 《以 不 同和 视角 ) 对 周围 环境 截取 的 6 张 图 
像 ， 而 这 些 图 像 最 终 会 存 于 一 个 立方 体 图 之 中 。 通 过 环境 图 我 们 惑 能 方 
便 地 泻 染 天 空 或 模拟 反射 。 





3. 通过 texassemble 工 具 便 可 以 用 6 个 单独 的 图 像 创 建 出 立方 体 图 ， 
并 以 DDS 图 像 的 格式 存 于 文件 之 中 。 由 于 立方 体 图 存 有 6 个 耗费 大 量 内 
存 的 2D 纹 理 ， 因 此 DDS 压 缩 格式 是 上 佳之 选 。 


4， 预 先 烘焙 的 立方 体 图 既 不 能 截取 场景 中 的 移动 对 象 ， 也 无 法 条 
集 在 它 生成 时 还 不 曾 存 在 的 物体 。 为 了 克服 这 种 限制 ， 我 们 需要 在 运行 
时 动态 地 构建 立方 体 图 。 也 就 是 说 ， 我 们 在 每 一 帧 都 要 将 摄像 机 架设 在 
场景 中 茶 处 ， 以 此 作为 立方 体 图 的 原点 ， 并 沿 着 每 个 坐标 轴 方 向 将 场景 
分 6 次 泻 染 至 每 个 立方 体 图 的 面 上 。 因 为 每 一 帧 都 要 重新 构建 立方 体 
图 ， 所 以 束 能 截取 到 动态 对 象 以 及 环境 中 的 每 一 样 物体 。 动 态 立 方 体 图 
的 开销 极 大 ， 因 此 应 当 谨 慎 地 将 它们 用 于 关键 物品 的 泻 染 。 











5. 我 们 可 以 将 纹理 数组 的 泻 染 目标 视图 绑 定 至 泻 染 流 水 线 的 OM 阶 
段 ， 也 能 对 纹理 数组 中 的 每 一 个 数组 切片 同时 进行 泻 染 。 利 用 系统 
值 SV_RenderTargetArrayIndex 便 可 以 把 三 角形 赋予 特定 的 这 染 目标 
数组 切片 。 假 设 现 有 一 个 纹理 数组 的 泻 染 目标 视图 ， 我 们 利 
用 SV_RenderTargetArrayIndex 系 统 值 即 可 一 次 性 泻 染 整个 场景 来 动 
态 地 生成 立方 体 图 ， 而 不 必 再 对 每 个 面 一 一 进行 绘制 〈 共 6 次 ) 。 但 
是 ， 这 个 策略 并 非 在 任何 情况 下 都 优 于 利用 视 锥 体 吻 除 共和 需 泻 染 场 景 6 
次 的 方法 。 





18.8 ”练习 








1. 在 “Cube Map” (立方 体 图 ) 演示 程序 中 尝试 不 同 的 FresnelR@ 
值 以 及 材质 粗糙 度数 据 。 再 试 着 令 该 例 程 中 的 柱子 和 立方 体 反 射 周围 的 
环境 。 


2. 寻找 从 某 个 环境 中 截取 的 6 幅 图 像 ( 可 以 从 网 络 中 搜索 立方 体 图 
的 图 像 ， 或 用 Terragen 这 种 程序 来 自行 制作 ) ， 并 通过 texassemble 工 具 
将 它们 合并 为 一 幅 立 方 体 图 。 最 后 以 “Cube Map” 演 示 程 序 来 验证 所 制作 
的 立方 体 图 。 


3. 电介质 (dielectric)〉 是 一 种 能 够 使 光线 发 生 折 射 的 透明 材质 ， 
原理 如 图 18.10 所 示 。 当 光线 照射 到 电介质 时 ， 一 部 分 会 被 反射 ， 另 一 
部 分 则 会 根据 斯 涅 尔 折射 定律 〈Snell's Law of Refraction) 发 生 折 射 。 
我 们 用 折射 紊 扣 与 m2 来 确定 光线 的 仿 折 程度 : 











1. 如 果 n1 二 m2， 那么 1 = 92 (不 发 生 折 射 〉。 


2. 如 果 n2 > mt， 那么 92 < 91 (折射 光线 靠近 法 线 )。 


3. 如 果 nli > n2， 那 么 92 > 91 (折射 光线 远离 法 线 )。 


立方 体 图 








图 18.10 ”光线 沿 入 射 向 量 V0 在 折射 率 为 1 的 介质 中 传播 。 待 光线 照射 到 折射 率 为 2 的 透明 材 

质 时 ， 将 按 辐 量 21 的 方 癌 发 生 折 射 。 此 时 ， 我 们 把 折射 向量 21 作 为 查找 立方 体 图 纹 素 的 向 量 。 

这 个 过 程 很 像 alpha 混 合 透 明 人 处 理 (alpha blending transparency) ， 只 是 后 者 不 会 让 入 射 向 量 发 生 
偏 折 





























如 此 一 来 ， 在 图 18.10 中 ， 由 于 "2 > m1， 因此 光线 在 进入 电介质 块 这 
部 分 区 域 时 ， 折 射 光线 同 法 线 方 同 偏 折 。 从 物理 学 上 来 讲 ， 光 线 在 离开 
此 区 域 时 还 会 再 次 发 生 折射 ， 但 对 于 实时 图 形 的 绘制 来 说 ， 一 般 只 针对 
首次 进入 电介质 区 域 时 发 生 的 光线 折射 进行 建 模 。HLSL 用 内 部 函 
数 refract 来 计算 折射 问 量 : 


float3 refract(float3 incident, float3 normal, float eta); 


第 一 个 参数 入 射 癌 量 即 入 射 光线 向 量 (图 18.10 中 的 vo》 ， 第 二 个 参 
数 法 向 量 为 指向 电介质 表面 外 侧 的 表面 法 线 〈 图 18.10 中 的 n〉， 第 三 个 
参数 是 折射 率 之 比 "1/"2。 真 空中 的 折射 率 为 1.0， 还 有 一 些 常见 的 折射 
率 ， 如 水 是 1.33、 玻 璃 为 1.51。 在 这 a ea 
序 ， 将 其 中 模拟 的 反射 替换 为 折射 效果 《〈 见 图 18.11) ， 在 这 个 过 程 





中 ， 我 们 或 许 还 需 适当 的 调整 MaterialData:: Roughness 数 值 。 另 
外 ， 请 分 别 尝试 设置 eta = 1.6、eta = 6.95 和 eta = 6.9， 并 观察 
效果 。 





4. 在 光源 经 反射 而 产生 镜面 高 光 的 过 程 中 ， 粗 糙 度 会 影响 镜面 反 
射 的 发 散 程度 。 因 此 ， 越 粗糙 的 表面 就 越 能 得 到 模糊 的 反射 效果 ， 因 为 
这 会 使 环境 图 中 的 多 个 样本 以 同样 的 角度 均匀 地 散射 到 观察 者 的 眼中 。 
试 研究 以 环境 图 (environment map) 来 模拟 模糊 反射 (blurry 
reflection) 的 技术 。 
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图 18.11 以 折射 代替 反射 的 “Cube Map” 例 程 效果 


[1] 问 物 体 映 冉 立 方 体 图 的 过 程 叫 作 立方 体贴 图 ， 类 似 的 还 有 纹理 贴图 
〈 回 物体 映射 纹理 图 ) 等 。 


[2] 读者 可 以 回顾 玩 360° 全 景 图 的 过 程 。 


[3] 最 新 版 的 设置 方式 与 旧版 有 些 区 别 ， 详 见 官方 文档 。 


[4] 简 而 言 之 ， 环 境 图 的 映射 方式 是 以 其 立方 体 中 心 为 端点 ， 同 立方 体 
发 出 射线 采集 纹 素 。 对 于 立方 体内 的 平面 而 言 ， 在 同一 入 射 角 观 察 不 同 
点 本 应 看 到 不 同 的 图 像 〈 即 采集 不 同 的 纹理 图 纹 素 ) ， 但 是 由 于 同 入 射 
角 所 用 的 loopup“《〈 碍 找 ) 向 量 是 相同 的 ， 所 以 在 相同 入 射 角 看 不 同 的 
点 ， 看 到 的 是 相同 的 内 容 。 图 18.6 是 “理想 ”的 采集 示意 图 ， 图 18.7 是 解 
决 方案 。 如 果 再 加 一 张 “ 实 际 ” 的 有 误 采 集 示 意图 或 者 指出 直接 与 图 
18.1 进 行 对 比 ) ， 会 更 明晰 。 














[5] slab 即 一 对 平行 平面 ， 一 个 立方 体 可 视 作 3 组 slab。 此 算法 的 大 意 是 
将 包 轩 盒 划分 为 3 组 slab，2D 疼 看 起 来 是 井 字 形 。 再 将 射线 与 slab 的 相交 
关系 转换 为 坐标 的 比较 ， 以 此 来 确定 光线 是 否 与 包围 盒 相 交 。 





第 19 章 ”法 线 贴图 


我 们 曾 在 第 9 章 中 介绍 过 纹理 贴图 ， 此 技术 通过 令 图 像 映 射 在 网 格 
el 
角形 中 进行 插值 的 法 问 量 仍然 被 定义 在 粒度 较 大 的 项 点 级 别 。 本 章 的 重 
头 戏 就 是 学 习 一 种 指定 更 高 分 辨 率 〈 即 细节 程度 更 高 的 ) 曲面 法 线 的 常 
用 方法 。 如 果 采 用 分 辨 率 更 高 的 曲面 法 线 ， 便 可 以 在 网 格 几 何 体 的 细节 
保持 不 变 的 情况 下 ， 使 光照 的 效果 得 到 提升 。 

















学 习 目 标 : 

1. 理解 为 什么 需要 法 线 贴 图 。 
2. 探索 如 何 存储 法 线 图 。 

3. 和 学习 如 何 创 建 法 线 图 。 


4. 探 宛 法 线 图 中 存储 的 法 回 量 是 相对 于 哪 种 坐标 系 而 定义 的 ， 而 
这 种 坐标 系 又 与 3D 三 角形 的 物体 空间 坐标 系 有 何 关 联 。 








5. 学 习 如 何在 顶点 着 色 串 与 像素 着 色 器 中 实现 法 线 贴图 。 


19.1 使 用 法 线 贴图 的 动机 





图 19.1 是 出 目 第 18 章 中 立方 体贴 图 演示 程序 的 有 关 场 景 ， 唯 独 其 中 
锥 形 圆柱 的 镜面 高 光 看 起 来 似乎 有 些 不 太 对 劲 一 一 与 砖 块 纹理 的 凹凸 有 
致 相 比 ， 它 们 看 起 来 平 请 得 不 甚 目 伏 。 这 是 由 于 纹理 表面 下 的 网 格 几 何 
体 太 过 平滑 ， 我 们 只 是 简单 地 把 凹凸 不 平 的 砖 块 材质 绘制 于 光滑 的 柱 面 
而 已 。 然 而 ， 又 因 光 照 是 基于 网 格 几 何 体 (特别 是 插值 项 点 法 线 ) 而 非 
纹理 图 像 来 进行 计算 的 ， 所 以 导致 光照 效果 并 不 完全 与 纹理 保持 一 致 。 





























在 理想 的 情况 下 ， 我 们 应 当 对 网 格 儿 何 体 进行 镶 租 化 处 理 ， 以 令 砖 
块 按 纹理 表面 下 的 几何 体 来 进行 建 模 ， 使 它们 像 真 实 的 砖 块 那样 错落 有 
致 、 纹 路 斑驳 。 这 样 一 来 ， 光 照 和 纹理 的 效果 就 能 达到 统一 。 硬 件 曲面 
细 分 确实 能 够 在 这 种 情形 中 派 上 用 场 ， 但 是 我 们 仍 需 以 东 种 方式 来 为 镶 
供需 指定 生成 项 点 所 需 的 法 线 〈 利 用 插值 法 线 并 不 能 提升 法 线 的 分 辩 
2 








男 一 种 可 行 的 解决 方案 是 将 光照 细节 直接 烘焙 〈bake) 到 纹理 之 
中 。 但 是 ， 在 光源 可 移动 的 情况 下 ， 这 种 方法 还 古 不 能 奏效 ， 这 是 因为 
在 光源 移动 的 过 程 中 ， 其 中 的 纹 素 颜色 却 始终 保持 不 变 。 





因此 ， 我 们 的 目标 就 变 为 寻找 动态 光照 (dynamic lighting) 的 实现 
方法 ， 以 使 纹理 图 和 光照 都 可 以 同时 展现 出 各 自 更 佳 的 细节 。 又 由 于 纹 
理 的 丰富 细节 是 与 生 俱 来 的 ， 因 而 问题 也 就 目 然而 然 地 转 同 寻求 与 纹理 
贴图 有 关 的 解决 方案 之 上 。 图 19.1 与 图 19.2 各 展示 了 同样 的 场景 ， 但 后 








者 使 用 了 法 线 贴图 (normal mapping) 技术 ， 根 据 图 片 我 们 可 以 明显 地 
看 出 还 是 动态 光照 与 砖 块 纹理 更 配 。 
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图 19.1 表现 出 光滑 平整 效果 的 镜面 高 光 
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图 19.2 ”表现 出 凹凸 有 致 效果 的 镜面 高 光 


19.2 什么 是 法 线 贴 图 


法 线 图 (normal map) 本 质 上 也 是 一 种 纹理 ， 但 其 中 每 一 个 纹 素 所 
存储 的 并 非 RGB 数据 ， 红 、 绿 、 赣 3 种 分 量 依次 存储 的 是 压缩 后 的 r、Y 
、z 坐 标 ， 这 些 坐 标定 义 的 即 是 法 同 量 。 也 就 是 说 ， 法 线 图 中 的 每 个 像 
素 内 都 存储 了 一 条 法 同 量 。 图 19.3 所 示 为 对 一 张 法 线 图 进行 可 视 化 处 理 
后 的 效果 。 












































) 、JV(z 轴 ) 3 个 向 量 所 定义 





























图 19.3” 存 于 法 线 图 中 的 法 线 ， 它 们 位 于 由 了 "(Zz 轴 ) 、 吾 〈2 币 
的 纹理 空间 坐标 系 之 中 。 向 量 了 "指向 纹理 图 像 的 右 侧 水 平方 向 ， 向 量 如 指向 纹理 图 像 的 下 侧重 
直方 向 ， 向 量 人 入 则 正 交 于 纹理 平面 











































































































为 了 便于 讲解 ， 假 设 以 下 示例 中 所 用 的 是 24 位 图 像 格式 ， 即 将 每 个 
颜色 分 量 都 存 于 1 字 节 之 中 ， 因 此 ， 每 个 颜色 分 量 的 取 值 范围 都 为 
[0,.255]《〈 人 至 于 32 位 的 图 像 格式 ， 其 中 的 alpha 分 量 可 以 保留 不 用 ， 也 可 以 
用 于 存储 其 他 的 标量 数据 ， 如 地 形 的 高 度 图 (heightmap ) 或 高 光 图 

(specular map， 也 称 为 镜面 反射 图 等 ) 。 当 然 ， 知 使 用 浮 点 格式 驶 不 
必 再 对 坐标 进行 压缩 了 ， 但 是 这 将 耗费 更 多 的 内 存 。) 

















注 Note 和 


如 图 19.3 所 示 ， 其 中 的 向 量 大 多 都 近似 平行 于 z 轴 。 换 言 之 ， 这 些 向 
量 的 z 值 取得 了 3 种 坐标 分 量 中 的 最 大 值 。 因 此 ， 当 把 法 线 图 视 作 彩色 图 
像 时 〈 也 就 是 按 每 个 法 线 的 RGB 值 进 行 绘制 ) ， 整 体会 呈现 蓝 色 。 这 是 
因为 z 坐 标 被 存 于 蓝 色 通 道 之 中 ， 而 大 部 分 法 线 又 取得 了 较 大 的 z 值 ， 所 
以 蓝 色 会 占据 图 像 的 大 部 分 区 域 。 








那么 ， 又 该 如 何 将 单位 癌 量 压缩 为 上 述 格式 呢 ? 首先 要 注意 到 的 
是 “单位 癌 量 ”一 词 ， 这 就 是 说 ， 每 个 坐标 的 范围 都 被 限定 在 [-1 1]。 如 
果 以 平移 及 缩放 的 手段 将 其 区 间 变 换 至 [0, 1]， 并 乘 以 255， 再 截断 
Gtruncate) 小数 部 分 ， 则 最 终 得 到 的 将 是 [0, 255] 的 某 个 整数 。 即 ， 如 
果 z 为 一 个 在 [-1, 1] 区 间 的 化 标 ， 则 f(z) 浮 数 得 到 的 整数 部 分 将 处 于 范围 
[0, 255] 之 中 。 在 这 里 ，f 的 定义 为 : 








f(z) = (0.57 十 0.5) .255 





因此 ， 为 了 在 24 位 图 像 中 存储 单位 癌 量 ， 仅 需 将 每 个 坐标 用 函数 / 
进行 变换 ， 再 把 变换 后 的 坐标 写 入 纹理 图 中 对 应 的 颜色 通道 即 可 。 





接 下 来 的 问题 是 怎样 实现 压缩 处 理 的 逆 操 作 ， 即 给 出 一 个 在 范围 [0， 
255] 内 的 压缩 后 的 纹理 坐标 ， 我 们 以 茶 种 方法 将 它 复 原 为 [-1 1] 区 间 内 
的 值 。 事 实 上 ， 通 过 f 的 反 函 数 即 可 方便 地 解决 此 问题 ， 经 过 简单 的 变 


即 ， 如 果 z 是 范围 在 [0, 255] 的 一 个 整数 ， 则 三 (z) 得 到 的 结果 是 范 
围 [-1 1] 区 间 的 一 个 浮 点 数 。 


我 们 不 必 亲 上 自动 手 参与 压缩 处 理 ， 因 为 借助 一 蒜 Photoshop 插 件 就 
能 将 图 片 轻松 转换 为 法 线 图 ， 所 以 只 是 在 像素 着 色 器 中 对 法 线 图 进行 采 
样 时 ， 还 是 要 实现 解压 缩 变换 过 程 中 的 一 些 步 又 。 我 们 用 类 似 于 下 列 的 
语句 在 着 色 器 中 对 法 线 图 进行 采样 : 


颜色 向 量 normalT 将 获取 归 一 化 分 量 构 成 的 坐标 (";9;?)， 其 中 
0<r,gb<1, 





可 见 ， 坐 标的 解压 工作 现 已 完成 一 部 分 了 《 即 压 缩 坐 标 已 除 以 
255， 由 位 于 [0, 255] 的 整数 变换 到 [0, 1] 区 间 之 内 的 浮 点 数 ) 。 接 下 来 ， 
我 们 就 要 用 函数 9 : I0, 1 一 [-1, 1 通过 平移 与 缩放 来 将 每 个 分 量 由 范围 
[0, 1] 变 换 到 区 间 [-1, 1]， 以 此 实现 整个 解压 缩 操作 。 此 函数 的 定义 为 : 


g(z) = 27—1 


在 代码 中 ， 我 们 用 此 函数 来 处 理 每 一 个 颜色 分 量 : 


// 将 每 个 分 量 从 [8,1] 解 压缩 至 [ -1,1]。 








normalT = 2.6f*normalT - 1.6f; 





由 于 标量 1.0 根 据 规则 会 被 扩充 为 向 量 (1, 1, 1)， 因 此 该 表达 式 会 按 
分 量 逐 个 进行 计算 。 


如 果 用 压缩 纹理 格式 来 存储 法 线 图 ， 那 么 
BC7 (DXGI_FORMAT_BC7_UNORM) 图 像 格式 的 质量 最 佳 ， 因 为 它 大 幅 
减少 了 因 压 缩 法 线 图 而 导致 的 误差 。 对 于 BC6 与 BC7 格 式 而 言 ，DirectX 
SDK 给 出 了 名 为 “BC6HBC7EncoderDecoder11” 的 相应 示例 。 我 们 可 通过 
这 个 程序 将 纹理 文件 转换 为 BC6 或 BC7 格 式 。 


19.3 ”纹理 空间 /切线 空间 


现在 我 们 来 考虑 将 纹理 映 冉 到 3D 三 角形 上 的 过 程 。 为 了 便于 讨 
论 ， 假 设 在 纹理 贴图 的 过 程 中 不 存在 纹理 扭曲 形变 的 现象 ， 即 在 将 纹理 
三 角形 映射 至 3D 三 角形 上 时 ， 仅 需 执 行 刚 体 变 换 ee 平移 操 
作 ) 。 现 在 ,我 们 就 可 以 把 纹理 看 作 是 一 张贴 纸 ， 通 过 拾取 、 平 移 以 及 
旋转 等 手段 ， 将 它 贴 在 3D 三 角形 上 。 图 19.4 展 示 了 纹理 坐标 系 的 坐标 轴 
相对 于 3D 三 角形 的 位 置 关 系 : 这 些 坐 标 轴 与 三 角形 相 切 ， 并 与 三 角形 
处 于 同一 平面 。 所 以 ， 三 角形 的 纹理 坐标 势必 也 就 相对 于 此 纹理 坐标 系 
而 定 。 再 结合 三 角形 的 平面 法 线 N， 我 们 便 获得 了 一 个 位 于 三 角形 所 在 
平面 内 的 3D TBN 基 (TBN-basis) ， 它 常 被 称 为 纹理 空间 (texture 
space) 或 切线 空间 (tangent space， 也 有 译作 正切 空间 、 切 空间 
等 ) 器。 值得 注意 的 是 ， 切 线 空间 通常 会 随 不 同 的 三 角形 而 发 生 改 变 
〈 见 图 19.5) 。 











现在 把 目光 转 回 图 19.3， 此 法 线 图 中 的 法 同 量 是 相对 于 纹理 空间 而 
定义 的 。 可 是 ， 我 们 所 用 的 光源 都 被 定义 在 世界 空间 之 中 。 为 了 实现 光 
照 效 果 ， 法 回 量 与 光源 必须 位 于 同一 空间 内 。 因 此 ， 当 前 的 首要 任务 就 
是 使 三 角形 顶点 所 在 的 物体 空间 坐标 系 ee space coordinate 


system ) 与 切线 空间 坐标 系 建立 联系 。 这 些 顶 点 位 于 物体 空间 之 
中 ， 我 们 束 能 通过 世界 矩阵 将 它们 从 物体 空间 变换 到 世界 空间 (在 下 一 
节 中 会 讨论 相关 细节 ) 。 设 纹理 坐标 分 别 为 (wo， vo)、 (ul, V1)、 (uo, U2) ) 的 顶 








扩 vV0、V1 和 v2 在 相对 于 纹理 坐标 系 坐 标 轴 〈 即 切 回 量 T 与 切 向 量 B) 构成 


的 纹理 平面 内 定义 了 一 个 三 角形 。 设 eo = zl 一 zo 且 el 二 v2 一 v0 为 3D 三 角 
形 的 两 个 边 同 量 ， 它 们 所 对 应 的 纹理 三 角形 边 向 量 则 分 别 为 

(Aw, Av0) = (Wu — Ww, 1 一 00 与 (Au Av1) = (ua — uo, v2 一 20)。 由 图 19.4 
可 以 看 出 它们 的 关系 : 





























图 19.4 ”一 个 三 角形 纹理 空间 与 物体 空间 的 关系 。3D 切 向 量 他 指向 纹理 坐标 系 4 轴 的 正方 向 ， 
而 3D 切 向 量 召 则 指向 纹理 坐标 系 5 轴 的 正方 向 

















B 


图 19.5 ”此 立方 体 诸 面 的 纹理 空间 都 是 各 不 相同 的 


el0 = AuoT 十 AvoB 
el = AuT + AuB 








用 相对 于 物体 空间 的 坐标 来 表示 这 些 向 量 ， 束 能 得 到 其 矩阵 方程 : 
EQ0r EQ0y Eco0>| At0 Avo 了 > Ty 了 :> 
elrz el €l,: Au Aul Br By B: 


注意 ， 我 们 已 经 知道 了 三 角形 顶点 的 物体 空间 坐标 ， 当 然 也 就 能 求 
出 边 同 量 的 物体 空间 坐标 。 因 此 ， 和 矩阵 


民 E0,y | 
El,r El El,:> 
是 已 知 的 。 同 理 ， 由 于 我 们 也 知道 了 纹理 坐标 ， 因 而 矩阵 
Aug Avuo 
?11 Avul 
亦 可 知晓 。 现 在 就 来 求 出 切 同 量 T 与 切 同 量 B 的 物体 空间 坐标 : 
了 > 了 7 了 : Aug Avo 3 EQr ED0y €0,: 
Br 也 B: Au Aul Elr ely €l,: 
i ] A | 名 CE0,y | 
AuoAv 一 AvoAu |—Au Auo Elr El el,: 


在 上 述 推导 过 程 中 ， 我 们 使 用 了 下 列 关 于 逆 和 矩阵 的 性 质 ， 假 设 有 和 矩 














a b 


阵 “ |. 中 则 有 : 


~ 1 1 —b 
1 { 
六 ad — be a 


要 知道 ， 切 向 量 T 与 切 同 量 B 在 物体 空间 中 一 般 均 不 是 单位 长 度 。 











而 且 ， 如 果 纹 理发 生 了 扭曲 形变 ， 那 么 这 两 个 同 量 也 将 不 再 互 为 正 交 规 
范 化 问 量 。 





按照 惯例 ， 荆 、B、N 三 个 向 量 通 常 分 别 被 称 为 切线 〈tangent， 也 
有 为 了 区 分 副 切 线 而 称 为 主 切 线 ) 、 副 法 线 思 (binormal， 亦 有 译作 次 
法 线 。 或 bitangent， 副 切线 ) 以 及 法 线 Cnormal) 。 


19.4” 顶 操 切线 空间 


在 上 一 节 中 ， 我 们 推导 出 了 任意 三 角形 所 对 应 的 切线 空间 。 但 是 ， 
如 果 在 进行 法 线 贴图 时 使 用 了 这 种 纹理 空间 ， 则 最 终 得 到 的 效果 会 呈现 
明显 的 三 角形 划分 痕迹 ， 这 是 因为 切线 空间 必定 位 于 对 应 三 角形 的 所 在 
平面 ， 以 致 贴图 面 不 够 圆滑 ， 直 来 直 去 全 是 棱角 。 因 此 ， 我 们 要 在 每 个 
顶点 处 指定 切 向 量 ， 并 重 施 求 平 均值 的 故 技 ， 令 顶点 法 线 更 趋 于 平滑 的 
表面 ， 化 粗糙 为 神奇 〈 可 回顾 8.2 节 进行 对 比 ) 。 














1. 通过 计算 网 格 中 共用 顶点 v 的 每 个 三 角形 的 切 癌 量 平均 值 ， 便 可 
以 求 出 网 格 中 任意 顶点 v 处 的 切 向 量 T。 


2. 通过 计算 网 格 中 共用 顶点 w 的 每 个 三 角形 的 副 切 癌 量 平均 值 ， 便 
能 够 求 此 网 格 中 顶点 v 处 的 副 切 向 量 B。 


一 般 来 讲 ， 在 计算 完 上 述 平 均值 之 后 ， 往 往 还 需要 对 TBN 基 进行 正 
交规 范 化 处 理 ， 使 这 3 个 同 量 相 互 正 交 且 均 具有 单位 长 度 。 这 通常 是 以 
格拉 姆 一 施 密 特 过 程 (Gram-Schmidt procedure) 来 实现 的 。 可 以 在 网 络 
上 找到 为 任意 三 角形 网 格 构 建 逐 顶点 切线 空间 的 相关 代码 1。 








在 我 们 当前 的 系统 中 ， 并 不 会 把 副 切 癌 量 如 直接 存 于 内 存 中 。 而 是 
在 用 到 B 时 以 B = N x TT 来 求 取 此 向 量 ， 公 式 中 的 NN 即 顶点 法 线 的 平均 
值 〈( 平 均 顶点 法 线 ) 。 因 此 ， 我 们 所 定义 的 顶点 结构 体 如 下 : 


struct Vertex 
{ 








XMFLOAT3 Pos ; 
XMFLOAT3 Normal; 
XMFLOAT2 TeXC; 
XMFLOAT3 TangentU 











前 文 曾 提 到 ， 我 们 在 程序 中 是 通过 GeometryGenerator 函 数 计算 
纹理 空间 中 坐标 轴 v 所 对 应 的 切 向 量 T 来 生成 网 格 的 〈 详 见 7.4.1 节 ) 。 
对 于 立方 体 和 栅 格 这 两 种 网 格 来 说 ， 指 定 其 每 个 顶点 处 切身 量 T 的 物体 
空间 坐标 并 不 是 件 难事 ( 见 图 19.5，。 而 对 于 圆柱 体 与 球体 来 讲 ， 为 了 
求 出 它们 每 个 顶点 处 的 切 向 量 T， 我 们 就 要 构建 圆柱 体 或 球体 其 具有 两 
个 变量 的 向 量 值 函 数 Plu,v) 并 计算 出 90P/04， 其 中 的 参数 4 也 常 被 用 作 纹 
理 坐 标 u。 














19.5 在 切线 空间 与 物体 空间 之 间 进 行 转换 


人 至此， 我 们 确定 了 网 格 中 每 个 顶点 处 的 正 交 规范 化 TBN 基 ， 而 且 也 
己 求 出 了 TBN 三 癌 量 相对 于 网 格物 体 空间 的 坐标 。 也 就 是 说 ， 我 们 已 经 


掌握 了 TBN 基 相对 于 物体 空间 坐标 系 的 坐标 ， 并 可 通过 下 列 矩 阵 将 坐标 
由 切线 空间 变换 至 物体 空间 : 
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TT 
N, N, N. 
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M opje EE 





由 于 该 矩阵 是 正 交 甜 阵 ， 所 以 其 逆 矩 阵 束 是 它 的 转 置 矩 阵 。 因 此 ， 
由 物体 空间 转换 到 切线 空间 的 坐标 变换 矩阵 为 : 


Tr Br Nz 
ly By Ny 
1 B: i 


} FT—1 Fl 
Miangent VE ect MI ovject = 


< 





在 我 们 所 编写 的 看 色 器 程序 中 ， 为 了 计算 光照 会 把 法 向量 从 切线 空 
间 变 换 到 世界 空间 。 对 此 ， 一 种 可 行 方法 是 首先 将 法 线 自 切线 空间 变换 
至 物体 空间 ， 而 后 再 以 世界 矩阵 把 它 从 物体 空间 变换 到 世界 空间 : 
Tivorld 一 | Ttange ntM opi ct ) M world 


然而 ， 由 于 和 矩阵 乘法 满足 结合 律 ， 因 此 可 以 将 公式 变 为 : 


Tyorld 一 Ntangent ( M oo ct Moria) 


注意 到 


PE a fs 
MojectMuord= | B 一 | Med 一 | 二 了 2|=|B, B, B. 
tN 3 N= Ns N, N. 














其 中 T= 二 T -Moywias B' 三 B: Maoonatll 及 N' 二 NN -Mvoiae 因此 ， 
要 从 切线 空间 直接 变换 到 世界 空间 ， 我 们 仅 需 用 世界 坐标 来 表示 切线 基 
(tangent basis) 即 可 ， 这 可 以 通过 将 TBN 基 从 物体 空间 坐标 变换 到 世界 
空间 坐标 来 实现 。 


我 们 所 关心 的 仅 是 同 量 的 变换 (而 非 点 的 变换 ) ， 因 此 用 3 x 3 和 矩阵 
来 表示 即 可 。 本 书 前 面 曾 讲 过 ， 仿 射 矩阵 的 第 4 行 是 用 于 执行 平移 变换 
的 ， 但 我 们 却 不 能 平移 癌 量 。 








19.6 ”法 线 贴 图 的 着 色 器 代码 
法 线 贴图 的 流程 大 致 如 下 。 


1. 通过 艺术 加 工 工具 或 图 像 处 理 程序 来 创造 预定 的 法 线 图 ， 并 将 
它 存 于 图 像 文件 之 中 。 在 应 用 程序 初始 化 期 间 以 这 些 图 像 文件 来 创建 
2D 纹 理 。 


2. 针对 每 一 个 三 角形 ， 计 算 其 切 辐 量 T。 通 过 对 网 格 中 共享 项 反 v 
ee 
的 切 向 量 〈 在 演示 程序 中 ， 由 于 使 用 的 是 简单 的 几何 图 形 ， 因 此 可 以 直 
接 指 定 出 相应 的 切 问 量 。 但 是 ， 如 果 处 理 的 是 由 3D 建 模 程 序 创建 的 不 
规则 形状 的 三 角形 网 格 ， 那 么 殉 需 要 按 上 述 方法 来 计算 切 同 量 的 平均 
值 ) 。 








3. 在 顶点 着 色 器 中 ， 将 顶点 法 线 与 切 同 量变 换 到 世界 空间 ， 并 将 
结果 输出 到 像素 着 色 器 。 








4. 通过 插值 切 辣 量 与 插值 法 癌 量 来 构建 三 角形 表面 每 个 像 系 点 处 
的 TBN 基 ， 再 以 此 TBN 基 将 从 法 线 图 中 采集 的 法 向 量 由 切线 空间 变换 到 
世界 空间 。 这 样 一 来 ， 我 们 束 拥 有 了 取 自 法 线 图 的 世界 空间 法 向 量 ， 并 
可 将 它 用 于 往常 的 光照 计算 。 





为 便于 法 线 贴图 的 实现 ， 我 们 在 Common.hlsl 文 件 中 加 入 了 以 下 函 
数 。 











float3 NormalSampleToWorldSpace(float3 normalMapSample, 
float3 unitNormalW, 
float3 tangentW) 











// 将 每 个 坐标 分 量 由 范围 [6,1] 解 压 至 [ -1,1] 区 间 
float3 normalT = 2.6f*normalMapSample - 1.6f; 




















// 构建 正 交 规范 基 
float3 N unitNormalW; 
float3 T = normalize(tangentW - dot(tangentW, N)*N); 
float3 B = cross(N, T); 


float3x3 TBN = float3x3(T, B, N); 





// 将 法 线 图 样本 从 切线 空间 变换 到 世界 空间 
float3 bumpedNormalW = mul(normalT, TBN); 


return bumpedNormalW; 








此 函数 可 以 在 像素 着 色 器 中 按 下 列 方式 调用 : 


float3 normalMapSample = gNormalMaps.Sample(samLinear,pin.Tex).rgb; 


float3 bumpedNormalW = NormalSampleToWorldSpace(normalMapSample, pin.Norma 
lW, pin. TangentW); 








有 两 行 代码 可 能 不 太 容 易 理解 : 


float3 N = unitNormalW; 
float3 T = normalize(tangentW - dot(tangentW, N)*N); 








插值 完成 后 ， 切 问 量 与 法 同 量 可 能 会 变 为 非 正 交 规范 同 量 。 以 上 两 
行 代码 通过 使 T 减 去 其 N 方 同上 的 分 量 ( 投 影 ，》， 再 对 结果 进行 规范 化 
处 理 ， 从 而 使 工 成 为 规范 化 向 量 且 正 交 于 《〈 见 图 19.6) 。 注 意 ， 这 里 
假设 unitNormalW 为 规范 化 向 量 。 
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图 196 由 于 | = 1 projy(T) = (TN)N， 所 以 切线 芽 的 分 量 T 一 Proj (TT) 正 交 
于 法 线 IV 








只 要 获取 了 法 线 图 中 的 法 线 〈( 也 称 “bumped normal”， 和 直 详 作 四 凸 
法 线 ， 即 方 同 不 一 的 法 线 ， 可 令 光 照 表 现 出 物体 表面 凹凸 不 平 的 效 
果 ) ， 即 可 将 它 运用 于 法 疝 量 所 参与 的 一 切 后 续 计 算 ( 如 光照 、 立 方 体 
贴图 ) 。 完 整 的 法 线 贴图 效果 实现 如 下 ， 其 中 与 法 线 贴图 相关 的 部 分 都 
己 用 黑体 字 标 出 。 





OA 


// Default.hlsl 的 作者 为 Frank Luna (C) 2615 版 权 所 有 


/ /党 术 米 玉 洲 业 米 米 线 米 玉米 玉米 米线 洲 江 玉 六 玉米 炒米 玉米 水 水 沿 炒米 米 洲 水 类 米 米 沙洲 洲 玉 玉米 米 洲 米 米 水 玉米 沙洲 炒米 玉米 玉 玉 炒米 洲 水 玉 玉 洲 汪 米 米 洲 








// 默认 的 光源 数量 

#ifndef NUM_DIR_LIGHTS 
#define NUM DIR LIGHTS 3 

#endif 


#ifndef NUM POINT_ LIGHTS 
#define NUM POINT LIGHTS 6 

#endif 

#ifndef NUM SPOT_LIGHTS 


#define NUM SPOT_LIGHTS 6 
#endif 


// 包含 公用 的 HLSL 代 码 


#include "Common.hlpsl1" 
struct VertexIn 


float3 PosL : POSITION; 


}; 


float3 NormalL : NORMAL; 
float2 TexC : TEXCOORD; 
float3 TangentU : TANGENT; 


struct VertexOut 


{ 


}; 


float4 PosH : SV_POSITION; 
float3 PosW : POSITION; 
float3 NormalW : NORMAL; 
float3 TangentW : TANGENT; 
float2 TexC : TEXCOORD; 


VertexOut VS(VertexIn vin) 


{ 


} 


VertexOut vout = (VertexOut)0.0ef; 





// 获取 材质 数据 
MaterialData matData = gMaterialData[gMaterialIndex]; 














// 把 顶点 变换 到 世界 空间 
float4 posW = mul(float4(vin.PosL, 1.6f), gWorld); 
vout.PosW = posW.xyz; 
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// 假设 这 里 执行 的 是 等 比 缩放 ， 和 否则 就 需要 使 用 世界 窍 阵 的 逆转 置 久 
vout .NormalN = mul(vin.NormalL, (float3x3)gWorld); 














vout.TangentW = mul(vin.TangentU， (float3x3)gWorld); 











// 将 项 点 变换 到 齐 次 裁 鸡 空间 


vout.PosH = mul(posW, gViewpPro]j); 











rr 


// 为 三 角形 插值 而 输出 顶点 属性 
float4 texC = mul(float4(vin.TexC, 68.6f, 1.6f), gTexTransform); 
vout.TexC = mul(texC, matData.MatTransform) .xy; 























return vout; 


float4 PS(VertexOut pin) : SV_Target 


{ 





// 获取 材质 数据 
MaterialData matData = gMaterialData[gMaterialIndex]; 
float4 diffuseAlbedo = matData.DiffuseAlbedo 

float3 fresnelR6 = matData.FresnelRe; 

float roughness = matData.Roughness; 

uint diffuseMapIndex = matData.DiffuseMapIndex; 


uint normalMapIndex = matData.NormalMapIndex; 




















= 


// 对 法 线 插值 可 能 使 它 非 规 范 化 ， 因 此 要 再 次 对 它 进行 规范 化 处 理 


pin.NormalW = normalize(pin.NormalW); 

















float4 normalMapSample = gTextureMaps[normalMapIndex] .Sample( 
gsamAnisotropicWrap, pin.TexC); 

float3 bumpedNormalW = NormalSampleToWorldSpace( 
normalMapSample.rgb, pin.NormalW, pin.Tangentw); 








// 去 掉 下 列 注释 则 禁用 法 线 贴 图 
//bumpedNormalW = pin.NormalW; 





























// 动态 查找 数 组 中 的 纹理 
diffuseAlbedo *= gTextureMaps[diffuseMapIndex].Sample( 
gsamAnisotropicWrap, pin.TexC); 
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// 由 表面 上 茶点 指向 观察 点 的 向 量 
float3 toEyeW = normalize(gEyePosW - pin.PosW); 








// 光照 项 
float4 ambient = gAmbientLight*diffuseAlbedo; 


// Alpha 通 道 存储 的 是 逐 像素 级 别 上 的 光泽 度 

const float shininess = (1.6f - roughness) * normalMapSample.a; 

Material mat = { diffuseAlbedo, fresnelR@, shininess }; 

float3 shadowFactor = 1.6f; 

float4 directLight = ComputeLighting(gLights, mat, pin.PosW, 
bumpedNormalW, toEyeW, shadowFactor); 








float4 litColor = ambient + directLight; 








// 利用 法 线 图 中 的 法 线 计算 镜面 反映 

float3 r = reflect(-toEyeW, bumpedNormall); 

float4 reflectionColor = gCubeMap.Sample(gsamLinearWrap, r); 

float3 fresnelFactor = SchlickFresnel(fresnelR@, bumpedNormalW, r); 
litColor.rgb += shininess * fresnelFactor * reflectionColor.rgb; 























// 从 漫 反 射 反 照 率 中 获取 alpha 值 的 常规 方法 
litColor.a = diffuseAlbedo.a; 


return litColor; 








可 以 看 出 ， 那 些 名 为 “凹凸 法 线 (bumped normal) ”的 向 量 既 可 用 于 





光照 计算 ， 又 能 用 在 以 环境 图 模拟 反射 的 反射 效果 计算 当中 。 另 外 ， 我 
们 在 法 线 图 的 alpha 通 道 存储 的 是 光泽 度 掩 码 (shininess mask) ， 它 控制 
者 逐 像 素 级 别 上 物体 表面 的 光泽 度 〈 见 图 19.7) 。 
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图 19.7” 随 书 所 附 DVD 中 tile_nmap.dds 图 像 所 存 的 alpha 通 道 。 该 alpha 通 道中 的 数据 
表示 的 是 物体 表面 的 光泽 度 。 白 色 部 分 的 光泽 度 值 为 1.0， 黑 色 部 分 的 光泽 度 值 则 为 0.0。 
这 样 ， 我 们 就 获得 了 一 种 用 于 逐 像素 控制 光泽 度 的 材质 属性 





19.7 小 结 


1. 法 线 贴图 的 策略 是 将 法 线 图 映 冉 到 多 边 形 之 上 。 这 样 一 来 即 可 
ee 通过 它 便 可 以 捕捉 到 物体 表面 上 的 凸 起 、 四 

裂痕 等 更 为 丰富 的 细节 。 因 此 ， 我 们 就 能 利用 这 些 取 目 法 线 图 中 的 
se 








2. 法 线 图 本 质 上 就 是 一 种 纹理 ， 但 它 的 每 个 纹 素 中 存储 的 并 非 
RGB 颜色 数据 ， 在 其 红色 、 绿 色 以 及 赣 色 3 种 分 量 中 分 别 存储 的 是 经 过 
压缩 的 -、y、z 法 线 坐标 。 我 们 可 以 利用 各 种 工具 来 生成 法 线 图 。 


3. 法 线 图 中 的 法 线 坐 标 相对 于 纹理 空间 坐标 系 而 定 。 因 此 ， 为 了 
实现 光照 计算 ， 我 们 需要 将 法 线 从 纹理 空间 变换 至 世界 空间 ， 以 令 光源 
与 法 线 位 于 同一 坐标 系 中 。 构 建 在 每 个 项 点 处 的 TBN 基 则 用 于 协助 从 纹 

空间 到 世界 空间 的 变换 。 


19.8 练习 


1. 下 载 NVIDIA 公 司 制作 的 法 线 图 插件 ， 并 用 它 来 创建 几 幅 不 同 的 
法 线 图 来 熟悉 它 的 使 用 方法 。 试 大 将 生成 的 法 线 图 应 用 到 本 章 的 演示 程 
原 当 审 。 

2. 下 载 CrazyBump 程 序 的 试用 版 。 用 此 程序 来 加 载 彩 色 图 像 ， 并 
生成 法 线 图 与 位 移 图 (displacement map， 见 第 5 题 ) 来 熟悉 此 程序 的 用 
法 。 最 后 尝试 将 这 两 种 图 用 于 本 章 的 应 用 程序 之 中 。 








3. 如 果 我 们 对 纹理 应 用 了 旋转 变换 ， 那 么 还 需要 旋转 相应 的 切线 
空间 坐标 系 。 试 解释 为 什么 要 这 样 做 。 事 实 上 ， 这 就 意味 着 我 们 需要 在 
世界 空间 中 使 切线 T 绕 厦 法 线 N 旋 转 ， 这 会 涉及 开销 较 大 的 三 角 函 数 运 
算 〈 更 准确 地 说 ， 要 执行 的 是 关于 任意 轴 六 的 旋转 变换 ) 。 而 男 一 种 解 
决 方案 则 是 先 将 工 由 世界 空间 变换 到 切线 空间 ， 这 时 ， 我 们 就 可 以 利用 
纹理 变换 矩阵 来 二 接 对 并 进行 旋转 操作 ， 而 后 再 将 其 变换 回 世 界 空间 。 








4. 大 不 希望 在 世界 空间 中 进行 光照 计算 ， 我 们 可 以 将 观察 网 量 与 
光 回 量 都 由 世界 空间 变换 到 切线 空间 ， 并 将 所 有 的 光照 运算 都 移 至 切线 
空间 开展 。 试 着 修改 法 线 贴 图 着 色 器 ， 在 切线 空间 中 进行 光照 计算 。 


5. 位 移 贴图 (displacement mapping， 也 有 译作 置换 贴图 等 ) 的 思 
路 是 引入 一 种 名 为 高 度 图 (heightmap) 的 新 品 由 图 来 描述 物体 表面 的 
凹凸 不 平 。 些 图 党 与 硬件 曲面 细 分 配合 使 用 ， 它 指示 了 新 增加 的 顶点 在 
法 同 量 方向 上 的 侦 移 量 ， 以 此 来 为 网 格 增 汐 几何 细节 。 位 移 贴图 可 用 于 


实现 海浪 效果 ， 方 法 是 在 一 个 平坦 的 顶点 栅 格 上 ， 以 不 同 的 速度 和 方 
问 “ 深 动 ” 两 幅 ( 或 更 多 ) 高 度 图 。 我 们 在 每 个 栅 格 的 项 点 处 对 这 些 局 上 度 
图 进行 采样 ， 并 将 同一 顶点 处 的 高 度 值 加 在 一 起 ， 所 得 到 的 高 度 值 和 便 
是 茶 时 刻 此 实例 在 该 顶点 处 的 高 度 〈 即 y 坐 标 ) 。 通 过 深 动 高 度 图 ， 水 
小 就 能 连续 而 此 起 彼 估 地 自然 流动 起 来 ， 同 时 营造 出 一 种 “ 深 深 长 江东 
逝 水 ”的 视觉 效 末 〈 见 图 19.8) 。 设 置 这 个 练习 的 目标 为 通过 两 幅 可 以 下 
载 到 的 海浪 高 度 图 〈 以 及 对 应 的 法 线 图 ， 见 图 19.9) [4 来 实现 海浪 的 效 
果 。 为 了 展现 出 更 好 的 波浪 效果 ， 这 里 给 出 以 下 几 点 提示 。 























(a) 使 用 不 同 的 高 度 图 : 以 一 个 高 波幅 (high amplitude) 的 高 度 
图 来 模拟 波 面 宽 阔 的 低频 波浪 ， 而 以 男 一 个 低 波 幅 (low amplitude) 的 
高 度 图 来 模拟 波 面 细 肆 却 波 涛 润泽 的 高 频 波 浪 。 因 此 ， 我 们 束 需 要 针对 
这 两 种 高 度 图 采用 两 组 不 同 纹理 坐标 ， 以 及 分 别 运 用 两 种 不 同 的 纹理 变 
换 。 











(b) 所 用 的 法 线 图 纹理 应 当 比 高 度 图 纹理 的 数量 要 多 。 高 度 图 指 
定 了 波浪 的 形状 ， 而 法 线 图 则 负责 波浪 中 像素 的 照明 工作 。 法 线 图 应 当 
与 高 有 度 图 一 同 随 时 间 流 渤 而 进行 平移 ， 并 以 不 同方 辐 的 移动 给 入 以 波浪 
随机 翻腾 隐现 的 幻觉 。 这 两 种 法 线 可 以 按 下 列 方式 搭配 在 一 起 运用 : 














float3 normalMapSample@ = gNormalMap.Sample(samLinear, pin.WaveNormalTex@ 
) .rgb; 

float3 bumpedNormalWe = NormalSampleToWorldSpacel( 

normalMapSample6@, pin.NormalW, pin.TangentWw); 


float3 normalMapSamplel1 = gNormalMap1l.Sample(samLinear, pin.WaveNormalTex1 
) .rgb; 

float3 bumpedNormalW1 = NormalSampleToWorldSpacel 

normalMapSample1, pin.NormalW, pin.TangentWw); 


float3 bumpedNormalW = normalize(bumpedNormalwe + bumpedNormalW1); 





(c) 修改 波浪 的 材质 ， 使 它 更 接近 于 海洋 的 更 色 ， 并 且 保 留 来 自 
环境 图 的 部 分 反射 。 
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图 19.8 用 高 度 图 、 法 线 图 以 及 环境 贴图 所 模拟 出 的 海洋 波浪 效果 





图 19.9 上面 的 一 组 图 分 别 是 用 于 绘制 高 频 细碎 波浪 的 法 线 图 和 高 度 图 ， 


下 面 的 一 组 图 分 别 是 用 于 泻 染 低频 宽阔 波浪 的 法 线 图 与 高 度 图 











[1] 纹理 坐标 系 是 一 种 2D 坐 标 系 ， 而 这 里 称 为 “纹理 空间 ”的 切线 空间 
则 是 一 种 3D 化 标 系 。 为 了 避免 发 生 卜 义 ， 建 议 不 要 将 切线 空间 称 为 纹 
理 空间 ， 这 里 称 纹理 空间 纯 属 按 原 文 翻译 。 


[2] 严格 来 讲 ， 在 讨论 切线 空间 的 时 候 ， 切 线 空间 是 由 两 个 切 同 量 和 一 
个 法 回 量 来 确定 的 《从 图 中 19.4 中 也 可 以 看 出 )。 因 此 ， 这 三 个 癌 量 应 
分 别名 为 “*( 主 ) 切线 ”(tangent) 、“ 副 (次 ) 切线 ”(bitangent) 以 
及 “法 线 ”(normal) 。 可 参见 “Bitangent versus Binormal”* 或 叛逆 者 的 


《Binormal， 还 是 Bitangent， 这 是 个 问题 》。 


[3] 原文 名 为 《Computing Tangent Space Basis Vectors for an Arbitrary 
Mesh》。 感 谢 博 主 “ 码 疗 少 年 - 腊 腾 子 "对 原文 进行 了 翻译 。 





[4] 本 书 配套 网 站 上 的 d3d11CodeSet3.zip 文 件 ， 纹 理 路 径 为 
d3d11CodeSet3\SelectedCodeSolutions\DisplacementMappedWaves' 


Textures。 


第 20 章 ”阴影 贴图 


阴影 既 暗 示 着 光源 相对 于 观察 者 的 位 置 关 系 ， 也 从 侧面 传达 了 场景 
中 各 物体 之 间 的 相对 位 置 。 本 章 将 介绍 一 种 阴影 贴图 的 基本 算法 ， 这 是 
一 种 在 游戏 以 及 3D 应 用 程序 中 模拟 动态 阴影 的 常见 方法 。 对 于 读者 眼 
前 这 样 一 本 介绍 性 的 入 门 书籍 来 说 ， 我 们 仅 关 注 于 这 个 基本 的 阴影 贴图 
算法 。 而 像 级 联 阴影 贴图 (cascading shadow map ) [Engel06] 这 种 效果 
更 佳 却 也 更 为 复杂 的 阴影 技术 ， 实 则 都 是 由 这 基本 的 阴影 贴图 算法 扩展 
而 成 的 。 





学 习 目 标 : 


1. 探究 基本 的 阴影 贴图 算法 。 


2. 学 习 投影 纹理 贴图 的 工作 原理 。 


4. 了 解 阴影 图 的 走样 问题 并 学 习 修 正 该 问题 的 第 用 集 略 。 


20.1 演 染 场景 深度 


阴影 贴图 (shadow mapping， 也 有 译作 阴影 映射 ) 算法 依赖 于 以 光 
源 的 视角 泻 染 场景 深度 (scene depth， 即 场景 中 的 深度 信息 ) 一 一 从 本 
质 上 来 讲 ， 这 其 实 就 是 一 种 变相 的 “ 泻 染 到 纹理 ”技术 ， 本 书 曾 在 13.7.2 
节 中 对 后 者 进行 了 第 一 次 图 述 。 从 “ 泻 染 场景 深度 ”这 个 名 字 就 可 以 看 
出 ， 构 建 此 深度 缓冲 区 要 从 光源 的 视角 着 手 。 待 以 光源 视角 演 染 场景 深 
度 之 后 ， 我 们 就 能 知晓 离 光源 最 近 的 像素 片段 ， 即 那些 不 在 阴影 范围 之 
中 的 像素 片段 。 本 节 将 考察 一 个 名 为 shhadowMap 的 工具 类 ， 它 所 存储 的 
是 以 光源 为 视角 而 得 到 的 场景 深度 数据 。 其 实 此 工具 类 就 是 简单 地 封闭 
了 泻 染 阴影 会 用 到 的 一 个 深度 /模板 缓冲 区 、 一 个 视 口 以 及 多 个 视图 ， 
而 用 于 阴影 贴 图 的 那个 深度 /模板 缓冲 区 也 被 称 为 阴影 网 (shadow 


map) 。 




















class ShadowMap 
{ 
public: 
ShadowMap(ID3D12Device* device， 
UINT width, UINT height); 


ShadowMap(const ShadowMap& rhs)=delete; 
ShadowMap& operator=(const ShadowMap& rhs)=delete; 
~ShadowMap( )=default; 


UINT Width()const; 

UINT Height()const; 

ID3D12Resource* Resource(); 

CD3DX12 GPU DESCRIPTOR HANDLE Srv()const; 
CD3DX12 CPU DESCRIPTOR HANDLE Dsv()const; 


D3D12 VIEWPORT Viewport()const; 
D3D12 RECT ScissorRect()const; 


void BuildDescriptors( 
CD3DX12_CPU_DESCRIPTOR_HANDLE hCpuSryv, 
CD3DX12 GPU_DESCRIPTOR HANDLE hGpuSryv, 
CD3DX12 CPU DESCRIPTOR HANDLE hCpuDsv); 


void OnResize(UINT newWidth, UINT newHeight); 
private: 

void BuildDescriptors(); 

void BuildResourcel(); 
private: 


ID3D12Device* md3dDevice = nullptr; 


D3D12 VIEWPORT mViewport; 
D3D12 RECT mScissorRect; 


UINT mWidth = 6; 
UINT mHeight = 0; 
DXGI_FORMAT mFormat = DXGI FORMAT R24G8_TYPELESS; 


CD3DX12_CPU_DESCRIPTOR_HANDLE mhCpuSrv; 
CD3DX12_GPU_DESCRIPTOR_HANDLE mhGpuSrv; 
CD3DX12_CPU_DESCRIPTOR_HANDLE mhCpuDsyv; 


Microsoft: :WRL: :Comptr<ID3D12Resource> mShadowMap = nullptr; 








该 工具 类 的 构造 函数 会 根据 指定 的 尺寸 和 视 口 来 创建 纹理 。 阴 影 图 
的 分 辨 率 (resolution， 也 有 译作 解析 上 度 〉 会 直接 影响 阴影 效果 的 质量 ， 
但 是 在 提升 该 分 辩 率 的 同时 ， 泻 染 也 将 产生 更 多 的 开销 并 占用 更 多 的 内 
存 。 











ShadowMap: :ShadowMap(ID3D12Device*k device, UINT width, UINT height) 
{ 


md3dDevice = device; 


mWidth = width; 
mHeight = height; 


mViewport = { 8.6f, 86.6f, (float)width, (float)height, 6.6f, 1.6f }; 
mScissorRect = { 60, 60, (int)width, (int)height }; 


BuildResource( ) ; 


} 


void ShadowMap::BuildResource() 

{ 
D3D12 RESOURCE _ DESC texDesc; 
ZeroMemory(&texDesc, sizeof(D3D12 RESOURCE DESC)); 
texDesc.Dimension = D3D12 RESOURCE DIMENSION TEXTURE2D; 
texDesc.Alignment = 0@; 
texDesc.Width = mWidth; 
texDesc.Height = mHeight; 
texDesc.DepthOrArraySize = 1; 
texDesc.MipLevels = 1; 
texDesc.Format = mFormat; 
texDesc.SampleDesc.Count = 1; 
texDesc.SampleDesc.Quality = 6; 
texDesc.Layout = D3D12 TEXTURE LAYOUT _ UNKNOWN; 
texDesc.Flags = D3D12 RESOURCE FLAG ALLOW DEPTH_STENCIL; 


D3D12 CLEAR_VALUE optClear; 

optClear .Format = DXGI FORMAT D24 UNORM S8_UINT; 
optClear .DepthStencil.Depth = 1.6f; 
optClear.DepthStencil.Stencil = 0; 


ThrowIfFailed(md3dDevice->CreateCommittedResourcel 
&CD3DX12_HEAP_ PROPERTIES(D3D12 HEAP_ TYPE_ DEFAULT), 
D3D12_HEAP_FLAG NONE, 

&texDesc, 

D3D12 RESOURCE STATE_ GENERIC READ, 
&optClear， 
IID_PPV_ARGS(&mshadowMap ) ) ) ; 





我 们 即将 认识 到 : 阴影 贴图 算法 需要 执行 两 个 泻 染 过 程 (render 
pass) 。 在 第 一 次 泻 染 过 程 中 ， 我 们 要 以 光源 的 视角 将 场景 深度 数据 泻 
染 至 阴影 图 中 (后 文中 有 时 称 之 为 深度 绘制 过 程 ，depth pass) ; 而 在 第 
二 次 演 染 过 程 中 则 像 往 常 那样 ， 以 “玩家 ”的 摄像 机 视角 将 场景 演 染 至 后 
台 绥 冲 区 之 内 ， 但 为 了 实现 阴影 算法 ， 此 时 应 以 阴影 图 作为 着 色 器 的 输 
入 之 一 。 我 们 为 访问 着 色 器 资源 及 其 视图 而 提供 了 以 下 方法 。 








ID3D12Resource* ShadowMap: :Resource() 


{ 
return mShadowMap .Get(); 


} 


CD3DX12_GPU_DESCRIPTOR_HANDLE ShadowMap 
{ 


} 


return mhGpuSryv; 


CD3DX12_CPU_DESCRIPTOR_ HANDLE ShadowMap 
{ 


} 


return mhCpuDsyv; 


: :Srv()const 


: :Dsv()const 





20.2” 正 交 投 影 


我 们 此 前 一 直 使 用 的 是 透视 投影 (perspective projection) 。 透 视 投 
影 的 关键 特性 在 于 ， 物 体 离 观 察 点 越 远 ， 它 们 就 会 显得 越 小 〈( 即 近 大 远 
小 ) 。 这 与 我 们 在 现实 生活 中 对 物体 的 感官 是 一 致 的 。 除 此 之 外 ， 还 有 
一 种 名 为 正 交 投影 (orthographic projection， 也 有 译作 正 投影 ) 的 投影 
类 型 。 这 种 投影 主要 运用 于 3D 科 学 或 工程 应 用 之 中 ， 即 需要 平行 线 在 
投射 之 后 继续 保持 平行 的 情景 〈 而 不 是 像 透 视 投 影 那 样 交 于 灭 点 ) 。 因 
此 ， 正 交 投影 只 适用 于 模拟 平行 光 所 生成 的 阴影 。 沿 着 观察 空间 : 轴 的 
正方 向 看 去 ， 正 交 投 影 的 视 景 体 (viewing volume) 是 宽度 为 w、 高 度 为 
h、 近 平面 为 "x、 远 平面 为 1 的 对 齐 于 观察 空间 坐标 轴 的 长 方 体 〈 见 图 
20.1) 。 这 些 数据 定义 了 相对 于 观察 空间 坐标 系 的 长 方 体 视 景 体 。 




















使 用 正 交 投影 时 ， 其 投影 线 均 平行 于 观察 空间 的 > 轴 《 见 图 20.2) 。 
因此 我 们 可 以 看 到 ， 顶 点 (7,y, 引 的 2D 投 影 为 (7;)。 





近 平面 


图 20.1 正 交 视 景 体 是 一 个 轴 对 齐 于 观察 坐标 系 主轴 的 长 方 体 




















图 20.2” 诸 点 在 投影 平面 上 的 正 交 投影 。 正 交 投 影 的 投影 线 均 平行 于 观察 空间 的 2 


与 透视 投影 一 样 ， 我 们 既 硕 望 保 留 正 交 投影 中 的 深度 信息 ， 又 和 希望 
采用 规格 化 设备 坐标 。 Ce zs 间 变换 到 
NDC《〈 规 格 化 设备 坐标 ) 空间 ， 我 们 就 需要 通过 缩放 以 及 平移 操作 来 将 





[Bw] 


WwW AU hh 
观察 ee 
一 1 了 x [1, ]] x [0, 4。 把 上 述 关键 坐标 逐个 进行 对 比 变换 即 可 确定 该 
映射 。 对 于 前 两 对 坐标 来 说 ， 通 过 观察 区 间 的 差别 ， 即 可 借助 缩放 因子 
方便 地 将 它们 变换 到 NDC 空 间 : 


i 
2 hh | 
| ,2| -| 0 
We 则 需要 实现 7, 逢 习 10, 1 这 一 映射 。 在 此 ， 我 们 


将 寺 tt 三 az 十 b( 即 一 次 缩放 与 平移 变换 ) 。 由 于 9(7) =0 
且 9(f) = 1， 我 们 便 可 以 解 出 a 与 b: 




















an+b=0 


af 十 b=1 


通过 第 一 个 方程 可 知 = -an。 将 它 代 入 第 二 个 方程 ， 则 有 : 











af 一 0 一] 
本 二 
站 
所 以 : 
= 
因此 ， 
庆生 z n 
f= f—n 


读者 不 妨 绘 制 出 当 变 量 n 与 /满足 1 > "时 ， 函 数 9(z) 在 ,四 区 间 内 的 
图 像 。 





最 后 ， 我 们 可 得 到 将 观察 空间 坐标 (7,y, 3) 转 换 到 NDC 空 间 华 标 
(Z ,2 ) 的 正 交 变换 : 


b= = 
tw 
， 2 
y Pd 
加 刀 
可 f—n = 
或 者 用 和 窍 阵 表示 为 : 
2 0 0 0 
0 2 0 0 
2, yz, 1 = [2; y, z; J 0 0 1 | 








上 述 等 式 中 的 4 x 4 算 阵 即 为 正 交 投影 矩阵 (orthographic projection 


matrix) 。 


回顾 透视 投影 变换 可 以 知道 ， 我 们 不 得 不 将 这 个 变换 过 程 分 为 两 个 
部 分 : 一 个 是 通过 投影 矩阵 描述 的 线性 部 分 ， 兄 一 个 则 是 通过 除 以 ww 分 
量 来 描述 的 非 线性 部 分 。 相 比 之 下 ， 正 区 投影 变换 则 完全 是 一 种 线性 变 
换 一 一 因为 整个 过 程 都 不 需要 除 以 w 分 量 。 将 原 坐 标 乘 以 正 交 投影 矩阵 
便 可 以 直接 将 其 变换 为 NDC 坐 标 。 





20.3 ”投影 纹理 坐标 


投影 纹理 贴图 (projective texturing， 也 有 译作 投影 纹理 映射 、 投 影 
贴图 等 ) 技术 能 够 将 纹理 投射 到 任意 形状 的 几何 体 上 ， 又 因为 其 原理 与 
投影 机 的 工作 方式 比较 相似 ， 故 而 得 名 。 图 20.3 展 示 的 是 投影 纹理 贴图 
的 一 个 示例 。 



































图 20.3 ”通过 投影 纹理 贴图 技术 将 右 图 中 的 船 仍 头 纹理 投射 到 左 图 场景 中 的 多 个 几何 体 上 











投影 纹理 贴图 完美 地 模拟 了 投影 机 投射 光线 的 过 程 。 而 在 20.4 市 中 
我 们 将 看 到 ， 事 实 上 它 也 充当 着 阴影 贴图 过 程 中 的 一 个 关键 环 市 。 





投影 纹理 贴图 的 关键 在 于 为 每 个 像素 生成 对 应 的 纹理 坐标 ， 从 视觉 
上 给 人 一 种 纹理 被 投射 到 几何 体 上 的 感觉 。 我 们 将 生成 的 这 种 纹理 坐标 
称 为 投影 纹理 坐标 〈projective texture coordinate) 。 


从 图 20.4 可 以 看 出 ， 纹 理 坐 标 (w, "指定 了 应 当 被 投射 到 3D 点 P 上 的 
纹 素 。 义 由 于 化 标 (w, 2 相对 于 投影 窗口 中 的 纹理 空间 坐标 系 ， 精 确 地 指 
出 了 该 投影 窗口 中 点 P 的 投影 。 因 此 ， 生 成 投影 纹理 坐标 的 过 程 可 分 为 





如 下 步骤 。 


1. 将 点 Pp 投影 至 光源 的 投影 窗口 ， 并 将 其 坐标 变换 到 NDC 空 间 。 


2. 将 投影 坐标 从 NDC 空 间 变换 到 纹理 空间 ， 以 此 将 它们 转换 为 纹 
理 坐 标 。 








图 20.4 ”根据 光源 射 向 点 也 的 投影 线 ， 我 们 便 能 通过 相对 于 投影 窗口 中 纹理 空间 的 坐标 2;vj) 来 
确定 点 P 在 投影 窗口 中 的 纹 素 





通过 将 投影 机 的 光源 装置 作为 摄像 机 便 可 以 实现 步骤 1。 我 们 为 此 
光源 装置 定义 了 观察 矩阵 了 以 及 投影 矩阵 已 。 从 本 质 上 来 讲 ， 这 两 个 矩 
阵 分 别 定 义 了 光源 装置 位 于 世界 空间 中 的 位 置 、 朝 向 以 及 视 锥 体 。 和 矩阵 
VY 能 够 将 坐标 从 世界 空间 变换 到 光源 装置 的 坐标 系 〈 此 时 ， 以 投影 机 的 
光源 作为 “摄像 机 ”) 。 只 要 是 相对 于 光源 坐标 系 的 顶点 坐标 ， 经 过 投影 
和 矩阵 变换 以 及 齐 次 除法 ， 我 们 都 可 以 将 其 投影 到 光源 的 投影 平面 上 。 回 
顾 5.6.3.5 节 可 知 ， 在 执行 齐 次 除法 之 后 ， 坐 标 就 都 会 位 于 NDC 空 间 之 
中 。 





步骤 2 中 从 NDC 空 间 到 纹理 空间 变换 的 实现 ， 完 全 取决 于 下 列 坐 标 
变换 : 
u = 0.57 十 0.5 
v 一 一 0.5y 十 0.5 
其 中 ， 由 于 z, YE [上 ]， 所 以 w+ <s [0, 1。 我 们 为 y 坐 标 乘 以 一 1 以 
调转 此 轴 的 方向 ， 这 是 因为 NDC 华 标的 y 轴 正方 向 与 纹理 坐标 的 vu 轴 正方 
向 刚好 相反 。 纹 理 空 间 的 变换 可 以 用 矩阵 的 形式 来 表示 《可 参考 第 3 章 
中 的 练习 21) : 








05 0 00 
0 -05 0 0 
0 0 1 0| | 
0.5 0.5 0 1 

我 们 将 上 述 和 矩阵 了 称 为 “纹理 滤 阵 ”， 它 可 以 将 坐标 由 NDC 空 间 变 换 
到 纹理 空间 。 通 过 形 如 V PT 的 复合 变换 ， 我 们 束 可 以 将 坐标 从 世界 空 
间 直 接 变 换 到 纹理 空间 。 将 坐标 乘 以 这 个 组 合 变 换 之 后 ， 还 需 将 结果 进 
行 透视 除法 才能 完成 整个 变换 。 至 于 为 什么 要 在 纹理 变换 之 后 还 要 执行 
透视 除法 ， 可 参考 第 5 章 中 的 练习 8。 





20.3.1 代码 实现 


下 列 代码 展示 了 如 何 生成 投影 纹理 坐标 。 





struct VertexOut 


float4 PosH : SV_POSITION; 
float3 PosW : POSITION; 


float3 TangentW : TANGENT ; 
float3 NormalW : NORMAL ; 
float2 Tex : TEXCOORD6 ; 
float4 ProjTex : TEXCOORD1; 


}; 
VertexOut VS(VertexIn vin) 


VertexOut vout; 


[...] 


// 把 顶点 变换 到 光源 的 投影 空间 
vout.ProjTex = mul(float4(vin.posL，1.6f)， 
gLightWorldViewProjTexture); 





[...] 


return vout; 


} 


float4 PS(VertexOut pin) : SV_Target 
{ 
// 通过 除 以 w 来 完成 投影 变换 


pin.ProjTex.xyz /= pin.ProjTex.w; 





// NDC 空 间 中 的 深度 值 
float depth = pin.ProjTex.z; 





// 通过 投影 纹理 坐标 来 采集 纹理 
float4 c = gTextureMap.Sample(sampler, pin.ProjTex.xy); 





20.3.2” 视 锥 体 之 外 的 点 


在 泻 染 流水 线 中 ， 位 于 视 锥 体 之 外 的 几何 体 是 要 被 裁 甬 掉 的 。 但 
是 ， 在 我 们 以 光源 装置 的 视角 投影 几何 体 而 为 之 生成 投影 纹理 坐标 时 ， 
并 不 必 执 行 裁剪 操作 一 一 只 需 简 单 地 投影 顶点 即 可 。 因 此 ， 投 影 机 视 锥 














et 而 处 于 此 范围 的 
投影 纹理 坐标 在 被 采样 时 所 享受 的 待遇 ， 将 与 采集 [0, 1] 区 间 以 外 普通 纹 
理 时 所 用 寻 址 模式 《参见 9.6 节 ) 的 效果 相 一 致 。 


一 般 来 讲 ， 我 们 并 不 希望 对 投影 机 视 锥 体 以 外 的 几何 体 进行 贴图 ， 
因为 这 样 做 并 没有 任何 意义 “这些 几 何 体 并 不 会 被 投影 机 发 出 的 光照 射 
到 ) 。 常 见 的 做 法 是 使 用 颜色 分 量 丝 为 0 的 边框 颜色 寻 址 模式 。 而 男 一 
种 策略 则 是 将 投影 机 与 聚光灯 结合 在 一 起 ， 使 聚光灯 照射 范围 之 外 的 部 
分 不 受 光 照 〈 即 范围 之 外 的 物体 表面 不 会 被 投射 光照 射 到 ) 。 采 用 聚 光 
灯 的 优点 是 其 圆锥 体 照射 范围 内 中 心 的 光照 强度 最 大 ， 并 随 着 - 研 与 d 之 
i 

4 为 聚光灯 的 方向 向 量 。 可 回顾 8.12 节 的 内 容 ) 。 








20.3.3” 正 交 投 影 


我 们 刚刚 展示 了 如 何 通过 透视 投影 “在 平 截 头 体 的 范围 内 ) 来 进行 
投影 纹理 贴图 。 但 是 ， 为 了 投影 处 理 过 程 的 需要 ， 我 们 应 使 用 正 交 投影 
而 非 透视 投影 。 这 样 一 来 ， 纹 理 将 沿 光 线 传播 路 径 按 正 交 投影 方 盒 的 : 
轴 方 向 进行 投影 。 








除了 以 下 几 点 需要 注意 ， 此 前 讨论 的 投影 纹理 坐标 相关 内 容 都 可 以 
同样 应 用 于 正 交 透 影 。 首 先 ， 在 使 用 正 交 投影 时 ， 用 来 处 理 投 影 机 视 锥 
体 范 围 之 外 后 的 聚光灯 集 略 束 行 不 通 了 。 这 是 由 于 聚光灯 的 圆锥 体 照射 
范围 更 接近 于 透视 投影 的 平 截 头 体 ， 但 与 正 交 投影 的 长 方 体 却 相差 其 





测 





远 。 但 是 ， 我 们 仍然 能 使 用 纹理 寻 址 模式 来 处 理 位 于 投影 机 光源 照射 范 
围 之 外 的 点 ， 这 是 因为 正 交 投影 仍 需 生 成 NDC 坐 标 。 知 点 (zy > 位 于 
NDC 空 间 中 ， 当 且 仅 当 : 


其 次 ， 生 采用 正 区 投影 ， 便 无 需 进 行 除 以 w 项 计算 了 。 也 就 是 说 ， 
我 们 不 必 再 编写 下 列 代码 : 





// 通过 除 以 w 来 完成 投影 操作 





pin.ProjTex.xyz /= pin.ProjTex.w; 





原因 是 ， 在 完成 正 交 投影 后 ， 坐 标 已 经 变换 到 了 NDC 空 间 之 中 。 由 
于 每 个 像素 均 免 于 一 次 除法 操作 ， 所 以 正 交 投影 要 比 透 视 投影 速度 更 
快 。 从 另 一 方面 来 讲 ， 就 算 保留 了 除法 操作 也 不 会 影响 正 交 投影 ， 这 是 
因为 除数 是 1( 正 交 投 影 并 不 影响 Ww 坐标， 因而 w 的 值 总 为 1 )。 如 果 在 
着 色 嚣 代码 中 保留 了 除 以 w 的 操作 ， 则 统一 使 用 该 着 色 器 进行 透视 投影 
与 正 交 投影 均 可 正常 工作 。 当 然 ， 我 们 此 时 就 需要 在 代码 的 一 致 性 与 正 
交 投 影 不 必要 的 除法 操作 之 间 进 行 利 次 的 权衡 。 














20.4 什么 是 阴影 贴图 
20.4.1 算法 摘 述 


阴影 贴图 的 大 致 思路 是 ， 从 光源 的 视角 将 场景 深度 以 “ 泻 染 至 纹 
理 ” 的 方式 绘制 到 名 为 阴影 图 (shadow map) 的 深度 缓冲 区 中 。 上 述 工 
作 完 成 之 后 ， 我 们 融会 得 到 一 张 从 光源 视角 看 去 ， 由 一 切 可 见 像素 的 深 
度数 据 所 构成 的 阴影 图 〈 被 其 他 像素 所 遮挡 的 像素 不 在 此 阴影 图 之 列 ， 
因为 它们 在 深度 测试 时 将 会 失败 ， 所 以 它们 不 是 被 其 他 像素 所 履 写 
Coverwrite) 就 是 从 来 没有 被 写 入 过 ) 。 











为 了 以 光源 的 视角 演 染 场景 ， 我 们 需要 定义 一 个 可 以 将 坐标 从 世界 
空间 变换 到 光源 空间 的 光源 观察 矩阵 〈light view matrixz) ， 以 及 一 个 用 
于 描述 光源 在 世界 空间 中 照射 范围 的 光源 投影 矩阵 〈light projection 
matrix) 。 光 源 照 射 的 体积 范围 可 能 为 平 截 头 体 〈 透 视 投 影 ) 或 长 方 体 

《 正 交 投影 ) 。 通 过 在 平 截 头 体内 磐 入 聚光灯 的 照明 圆锥 体 ， 便 可 用 此 
平 截 头 体 光 源 体积 〈frustum light volume〉 来 模拟 聚光灯 光源 。 而 长 方 
体 光 源 体积 则 可 用 于 模拟 平行 光 光 源 。 然 而 ， 由 于 平行 光 被 限制 在 长 方 
体内 并 且 只 能 经 过 长 方 体 体积 范围 ， 因 此 它 只 能 照射 到 场景 中 的 一 部 分 
区 域 “ 见 图 20.5) 。 对 于 能 够 照射 到 整个 场景 的 光源 《例如 太阳 ) 来 
说 ， 我 们 就 可 以 扩展 光源 体积 ， 从 而 使 它 足 以 照 带 全 部 场景 。 












2 


光源 体积 





图 20.5 ”平行 光线 仅 在 光源 体积 中 传播 ， 所 以 只 有 位 于 该 体积 中 的 场景 部 分 才能 被 光照 射 到 。 
如 需 令 光源 照 过 整个 场景 ， 那 么 我 们 就 应 将 光源 体积 设置 为 可 容纳 整个 场景 的 大 小 








一 旦 阴影 图 构建 完成 ， 我 们 束 能 像 往 党 那样 以 “玩家 ”摄像 机 视角 来 
泻 染 场 景 。 针 对 每 一 个 要 被 泻 染 的 像素 P， 我 们 都 会 以 光源 的 视角 来 计 
算 其 深度 值 ， 并 将 它 记 为 dp)。 另 外 ， 在 使 用 投影 纹理 贴图 技术 时 ， 我 
们 还 要 沿 着 目光 源 至 像 系 P 的 路 径 来 对 阴影 图 采样 ， 以 获取 阴影 图 中 所 
存 的 深度 值 stp)。 此 值 即 为 光源 到 像素 P 这 一 路 径 中 ， 离 光源 最 近 像 素 的 
深度 值 。 从 图 20.6 可 以 发 现 ， 当 且 仅 当 dp) > sw)， 像 素 P 位 于 阴影 范围 
之 内 以 光源 的 视角 来 看 ， 表 面 上 的 点 P 被 球 遍 挡 ) 。 因 此 ， 当 且 仅 当 
dp) < s(p) 时 ， 像 素 P 位 列 阴影 之 外 。 


光源 的 位 置 光源 的 位 置 














光源 至 像素 p 的 路 径 






光源 至 像素 2 的 路 径 


d(p) > s(p) 


dp) alp) = stp) 





图 20.6 在 左 图 中 ， 从 光源 的 角度 上 看 ， 像 素 P 的 深度 值 为 4(P)。 但 是 ， 在 同一 光线 路 径 上 ， 高 


光源 最 近 的 像素 深度 值 为 SP)， 且 dtP) > s(P)。 因 此 我 们 便 能 推断 出 ， 以 光源 的 视角 来 看 ， 

在 像素 P 之 前 有 一 物体 遮 住 了 它 ， 因 此 了 P 便 生活 在 了 阴影 之 中 。 右 图 中 ， 从 光源 角度 来 看 ， 像 素 

P 的 深度 值 为 4(\P)， 而 且 在 光源 至 此 点 这 一 条 路 径 上 来 看 ， 它 离 光 源 最 近 。 即 5(P) 二 dfP)， 由 
于 我 们 可 以 推理 出 了 会 感受 到 光明 的 温暖 

















注音 Note > 


深度 值 要 用 NDC 坐 标 进行 比较 。 这 是 因为 阴影 图 其 实 是 一 种 深度 组 
冲 区 ， 它 存储 着 以 NDC 坐 标 表示 的 深度 值 。 那 么 具体 是 怎样 实现 的 呢 ? 
在 查阅 本 章 例 程 代码 之 后 谜底 目 然 会 揭晓 。 











20.4.2” 偏 移 与 走样 








明 影 图 存储 的 是 距离 光源 最 近 的 可 视 像 取 深度 值 ， 但 是 它 的 分 辨 率 
有 限 ， 以 致 每 一 个 阴影 图 纹 素 都 要 表示 场景 中 的 一 片区 域 。 因 此 ， 阴 影 
图 只 是 以 光源 视角 针对 场景 深度 进行 的 离散 采样 ， 这 将 会 导致 所 谓 的 阴 
影 粉 刺 〈shadow acne) 等 图 像 走 样 〈aliasing) 廿 问题 〈 见 图 20.7) 。 











图 20.8 展 示 的 简明 示意 图 解释 了 为 什么 会 发 生 阴 影 粉 刺 现象 。 一 种 
简单 的 解决 方案 是 通过 恒定 偏 移 (bias) 量 对 阴影 图 的 深度 值 进行 调 
整 。 图 20.9 演 示 的 就 是 更 正 该 问题 的 过 程 。 

















图 20.7 ”注意 图 中 地 面 上 光影 之 间 轮 流 交 蔡 的 “ 阶 状 " 条 纹 。 这 种 混 登 现象 通常 被 称 为 阴影 粉刺 














pi 场景 中 的 多 边 形 


图 20.8 ”利用 阴影 图 采集 场景 中 的 像素 深度 值 。 从 图 中 可 以 看 出 ， 由 于 阴影 图 的 分 辨 率 有 限 ， 
所 以 每 个 阴影 图 纹 素 要 对 应 于 场景 中 的 一 块 区 域 〈 而 不 是 点 对 点 的 关系 ， 一 个 坡 面 代表 阴影 图 
中 一 个 纹 素 的 对 应 范围 ) 。 从 观察 点 已 查 看 场景 中 的 两 个 点 P1 与 P2， 它 们 分 别 对 应 于 两 个 不 同 
的 屏幕 像素 。 但 是 ， 从 光源 的 观察 角度 来 看 ， 它 们 却 都 有 着 相同 的 阴影 图 纹 素 〔 即 
s(p1) 三 5(p2) 二 s， 由 于 分 辨 率 的 原因 ) 。 当 我 们 在 执行 阴影 图 检测 时 ， 会 得 到 4d(P1) > 5 
以 及 dlP2) 二 5s 这 两 个 测试 结果 。 这 样 一 来 ，P1 将 被 绘制 为 如 同 它 在 阴影 中 的 颜色 ，P2 将 被 演 
染 为 好 似 它 在 阴影 之 外 的 颜色 。 这 便 会 导致 阴影 粉刺 











图 20.9 通过 偏 移 阴影 图 中 的 深度 值 来 防止 出 现 错误 的 阴影 效果 。 此 时 ， 我 们 便 可 得 到 
dlp1) < s 与 dp2) < 5。 但 寻找 合适 的 深度 偏 移 量 通 常 要 通过 尝试 若干 


偏 移 量 过 大 会 导致 名 为 peter-panning (彼得 . 潘 ， 即 小 飞 使， 他 曾 
在 一 次 逃跑 时 弄 丢 了 自己 的 影子 ) 的 失真 效果 ， 使 阴影 看 起 来 与 物体 相 











然而 ， 并 没有 哪 一 种 固定 的 偏 移 量 可 正确 地 运用 于 所 有 几何 体 的 阴 
影 绘制 。 特 别 是 图 20.11 中 所 示 的 那 种 (从 光源 的 角度 来 看 ) 有 着 极 大 
斜率 的 三 角形 ， 这 时 就 需要 选取 更 大 的 侦 移 量 。 但 是 ， 如 果 企 图 通过 一 
个 过 大 的 深度 仿 移 量 来 处 理 所 有 的 和 斜 边 ， 则 又 会 造成 如 图 20.10 所 示 的 


peter-panning 问 题 。 














图 20.10 ”peter-panning 失 真一 一 由 于 过 大 的 深度 偏 移 量 而 导致 的 阴影 与 柱 体 分 离 现象 








图 20.11 ”从 光源 的 视角 来 讲 ， 有 着 极 大 和 斜率 的 多 边 形 要 比 有 着 较 小 斜率 的 多 边 形 采 用 更 大 的 偏 


移 量 














因此 ， 我 们 绘制 阴影 的 方式 就 是 先 以 光源 视角 度量 多 边 形 斜 面 的 冬 
率 ， 并 为 斜率 较 大 的 多 边 形 应 用 更 大 的 偏 移 量 。 幸 运 的 是 ， 图 形 硬件 内 
部 对 此 有 相关 技术 的 支持 ， 我 们 通过 名 为 斜率 缩放 仿 移 (slope-scaled- 
bias， 也 有 详 作 和 斜率 偏 移 补 偿 等 ) 的 光栅 化 状态 属性 就 可 以 轻松 实现 。 





typedef struct D3D12 RASTERIZER DESC { 
[is] 
INT DepthBias; 
FLOAT DepthBiasClamp; 
FLOAT SlopeScaledDepthBias; 
] 





} D3D12_ RASTERIZER_DESC; 





1. DepthBias: 一 个 固定 的 应 用 偏 移 量 。 对 于 格式 为 UNORM 的 深度 
缓冲 区 而 言 ， 可 参考 下 列 代码 注释 中 该 整数 值 的 设置 方法 。 





2. DepthBiasClamp: 所 允许 的 最 大 深度 偏 移 量 。 以 此 来 设置 深度 





偶 移 量 的 上 限 。 不 难 想象 ， 极 其 陡峭 的 倾斜 度 会 致使 斜率 缩放 偏 移 量 过 
大 ， 继 而 造成 peter-panning 失 真 。 


3. SlopescaledDepthBias: 根据 多 边 形 的 斜率 来 控制 偶 移 程度 
的 缩放 因子 。 有 基体 配置 方法 可 参见 下 列 代 码 注 释 中 的 公式 。 





注意 ， 在 将 场景 泻 染 至 阴影 图 时 ， 便 会 应 用 该 斜率 缩放 偏 移 量 。 
这 是 由 于 我 们 希望 以 光源 的 视角 基于 多 边 形 的 斜率 而 进行 偏 移 操作 ， 从 
而 避免 阴影 失真 。 因 此 ， 我 们 就 会 对 阴影 图 中 的 数值 进行 偏 移 计算 〈 即 
由 硬件 将 像素 的 深度 值 与 偏 移 值 相 加 ) 。 在 演示 程序 中 采用 的 具体 数值 
如 ks 








// [出 自 MSDN] 

// 如 果 当 前 的 深度 缓冲 区 采用 UNORM 格 式 且 与 输出 合并 阶段 绑 定 在 一 起 ， 或 深度 缓冲 区 还 没 
有 执行 绑 定 操作 ， 

// 则 偏 移 量 的 计算 过 程 如 下 

// 

// Bias = (float)DepthBias * r + SlopescaledDepthBias * MaxDepthSlope; 

// 

// 这 里 的 r 是 在 将 深度 缓冲 区 格式 转换 为 float32 类 型 后 ， 其 深度 值 可 取 到 的 大 于 6 的 最 小 
可 表示 的 值 

// [MSDN 援 引 部 分 结束 ] 

// 

// 对 于 一 个 24 位 的 深度 缓冲 区 来 说 , r = 1 / 2^24 

// 

// 例如 : DepthBias = 166666 ==> 实际 的 DepthBias = 166666/2^24 = .666 













































































// 这 些 数据 极其 依赖 于 实际 场景 ， 因 此 我 们 需要 对 特定 场景 反复 尝试 才能 找到 最 合适 的 偏 移 
数值 

D3D12 GRAPHICS PIPELINE STATE DESC smapPsoDesc = opaquePsoDesc; 
smapPsoDesc.RasterizerState.DepthBias = 10668080; 
smapPsoDesc.RasterizerState.DepthBiasClamp = 6.6f; 
smapPsoDesc.RasterizerState.SlopeScaledDepthBias = 1.6f; 














注 意 Note a 


深度 偏 移 太 生 在 光 棚 化 期 间 〈 裁 芯 阶 段 之 后 )， 因 此 不 会 对 几何 体 


裁 甬 造成 影响 。 


注 意 Note ip 


至 于 深度 偏 移 的 完整 细节 ， 可 搜索 SDK 文 档 中 的 文章 Depth 
Bias《〈 深 度 偶 移 ) 。 此 文 不 仅 给 出 了 该 技术 相关 的 全 部 规则 ， 而 且 介绍 
了 如 何 使 用 浮 点 深度 缓冲 区 进行 工作 。 








20.4.3 ”百分比 渐 近 过 滤 


在 用 投影 纹理 坐标 \w "对 阴影 图 进行 采样 时 ， 往 往 不 会 命中 阴影 图 
中 纹 素 的 准确 位 置 ， 而 是 通常 位 于 阴影 图 中 的 4 个 纹 素 之 间 。 帮 执行 的 
是 颜色 贴图 〈color texturing) ， 那 么 使 用 双 线 性 插值 9.5.1 节 ) 即 可 解 
决 该 问题 。 但 是 [Kilgard01] 却 指出 ， 我 们 不 应 对 深度 值 采 用 平均 值 法 ， 
因为 这 可 能 导致 把 像素 误 标 入 阴影 中 这 样 的 错误 结果 (出 于 同样 的 原 
因 ， 我 们 也 不 能 为 阴影 图 生成 mipmap ) 。 考 虑 至 此 ， 我 们 应 当 对 采样 
的 结果 进行 插值 ， 而 不 是 对 深度 值 进行 插值 ， 这 种 方法 称 为 一 一 百分比 

















渐 近 过 滤 (Percentage Closer Filtering，PCF) 。 即 我 们 以 点 过 滤 
CMIN_MAG_MIP_POINT) 的 方式 在 坐标 472 八 已 十 和 TD、 十 7z) 以 
及 以 + A7T,v 二 zi) 处 对 纹理 进行 采样 ， 其 中 

A7T=1/SHADOW -MAP -SIZE ( 除 以 的 是 阴影 贴图 的 大 小 ) 。 因 为 使 
用 的 是 点 采样 ， 所 以 这 4 个 采样 点 分 别 命 中 的 是 围绕 坐标 WwW) 最近 的 4 个 
明 影 图 纹 素 s0、s1、s2 与 3， 如 图 20.12 所 示 。 接 下 来 ， 我 们 会 对 这 些 采 
集 的 深度 值 进行 阴影 图 检测 ， 并 对 测试 的 结果 开展 双 线 性 插值 。 


static const float SMAP_ SIZE = 26048.6f; 
static const float SMAP DX = 1.6f / SMAP_SIZE; 








// 对 阴影 图 进行 采样 以 获取 离 光源 最 近 的 深度 值 

float s@ = gShadowMap.Sample(gShadowSam, 
projTexC.xy).r; 

float s1 = gShadowMap.Sample(gShadowSam, 
projTexC.xy + float2(SMAP DX, 8)).r; 

float s2 = gShadowMap.Sample(gShadowSam, 
projTexC.xy + float2(60, SMAP_ DX)).r; 

float s3 = gShadowMap.Sample(gShadowSam, 
projTexC.xy + float2(SMAP_ DX, SMAP_ DX)).r; 


// 该 像素 的 深度 值 是 否 小 于 等 于 阴影 图 中 的 深度 值 











float result@ = depth <= s0@; 
float result1 = depth <= s1; 
float result2 = depth “= s2; 
float result3 = depth 《= s3; 





// 变换 到 纹 素 空间 
float2 texelPos = SMAP_ SIZE*projTexC.xy; 








// 确 

















定 撮 


] 


值 变量 








float2 七 = frac( texelPos ); 


// 对 比较 结果 进行 双 线 性 插值 














return lerp( lerp(result@, result1, t.x), 
lerp(result2, result3, t.x), t.y); 





So 









® (ut+ Ax,v) 






(u,v + Ax) ® (Ut+ Ax,v + Ax) 


图 20.12 采集 4 个 阴影 图 样本 


右 末 用 这 种 计算 方法 ， 则 一 个 像素 整 可 能 局 部 处 于 阴影 之 中 ， 而 不 
再 是 非 黑 即 白 的 单 选 题 。 例 如 ， 奋 有 4 个 样本 ， 两 个 在 阴影 中 ， 妃 外 两 
个 在 阴影 外 ， 则 该 像素 有 50% 位 于 阴影 之 中 。 这 便 使 阴影 内 外 的 像素 之 
间 有 了 更 为 平滑 的 过 小， 而 非 校 角 分 明 《〈 见 图 20.13) 。 








图 20.13 ”在 上 侧 的 图 中 ， 我 们 可 以 明显 看 出 阴影 边界 处 的 “阶梯 状 ” 锯 齿 走样 。 在 下 侧 的 图 中 ， 
用 过 滤 的 方式 令 锯齿 走样 变 得 稍 加 平滑 


1 Note 


HLSL 中 的 frac 函 数 返 回 的 是 输入 浮 点 数 的 小 数 部 分 〈 即 尾数 ， 
mantissa) 。 比 如 说 ， 如 果 SMAP_SIZE = 1624 且 projTex.xy = 
(6.23，6.68)， 那 么 texelPos = (235.52，696.32) 且 
frac(texelPos) = (9.52，6.32)。 这 些小 数 指 示 着 样本 之 间 的 插值 
变量 。 而 HLSL 中 的 lerp(x，y，s) 函 数 则 是 线性 插值 函数 ， 它 将 返回 
z 二 sy 一 起 =(1 一 9 十 s8 的 计算 结果 。 


注意 Note 


尽管 采用 了 我 们 自己 编写 的 过 滤 方 法 ， 但 阴影 的 效果 仍然 非常 生 
便 ， 而 且 锯齿 失真 问题 的 最 终 处 理 效 果 还 是 不 能 令 人 十 分 满意 。 当 然 ， 
除 此 之 外 还 有 许多 行 之 有 效 的 方法 可 用 ， 如 [Uralsky05]。 我 们 也 可 以 辅 
以 更 高 分 状 率 的 阴影 图 ， 但 是 需要 在 效果 与 开销 之 间 进 行 取 使 。 





从 上 面 的 描述 中 也 可 以 看 出 PCF 过 滤 的 主要 缺点 ， 即 需要 4 个 纹理 
样本 。 和 采集 纹 理 原 本 就 是 现代 GPU 代价 较 高 的 操作 之 一 ， 因 为 存储 器 的 
囊 宽 与 延迟 并 没有 随 着 GPU 计算 能 力 的 剧 增 而 得 到 相近 程度 的 巨大 改良 


[Miller08]。 幸 运 的 是 ， 我 们 已 经 能 够 通过 调用 SampleCmpLeve1lZero 
方法 来 调 取 兼 容 Direct3D 11+ 版 本 的 图 形 硬件 对 PCF 技 术 的 内 部 支持 。 





Texture2D gShadowMap : register(t1); 
SamplerComparisonState gsamShadow : register(s6); 


// 通过 除 以 w 来 完成 投影 操作 


shadowPosH.xyz /= shadowPosH.w; 





// 在 NDC 空 间 中 的 深度 值 
float depth = shadowPosH.z; 


// 自动 执行 4-tap PCF 
gShadowMap .SampleCmpLevelZero(gsamShadow, 
shadowPosH.xy, depth).r; 











方法 名 字 中 的 LevelZzero 部 分 意味 着 只 能 在 最 高 的 mipmap 层 级 中 
才能 执行 此 函数 的 相应 任务 。 这 是 极 好 的 ， 因 为 我 们 仪 希望 针对 阴影 贴 
图 进行 采样 并 比较 采样 结果 (而 不 会 为 阴影 图 生成 mipmap 链 〉。 此 方 
法 使 用 的 并 非 普 通 的 采样 器 对 象 ， 而 是 比较 采样 颖 (comparison 
sampler) SamplerComparisonState。 这 使 硬件 能 够 执行 阴影 图 的 比较 测 
试 ， 且 需要 在 过 滤 采 样 结 末 之 前 完成 。 对 于 PCF 技 术 来 说 ， 我 们 需要 使 
用 D3D12_FILTER COMPARISON MIN MAG LINEAR MIP_POINT 过 过 站 
器 ， 并 将 比较 函数 设置 为 LESS_EQUAL〈 由 于 对 深度 值 进行 了 偏 移 ， 所 
以 也 要 用 到 LESS 比 较 函 数 ) 。 此 方法 的 前 两 个 参数 分 别 为 比较 采样 器 对 
象 以 及 纹理 坐标 ， 第 三 个 参数 则 是 与 阴影 图 样本 相 比较 的 数值 。 在 将 比 
较 数 值 设 置 为 depth 并 把 比较 函数 设 定 为 LESS_EQUAL 之 后 ， 它 将 执行 
以 下 比较 操作 : 











float resulto 
float result1 
float result2 


depth “= s0; 
depth <= s1; 
depth <= s2; 


float result3 = depth <= s3; 


接着 ， 在 通过 硬件 线性 插值 得 到 最 终 的 计算 结果 之 后 ， 便 完成 了 
PCF 的 整个 工作 流程 。 








下 列 代码 展示 了 如 何 为 阴影 贴图 配置 比较 采样 占 。 


const CD3DX12 STATIC SAMPLER DESC shadow( 
6，// 着 色 器 寄存 器 (shaderRegister) 
D3D12_FILTER _COMPARISON _MIN _MAG LINEAR_MIP_POINT，// 过 滤器 类 型 (filter) 
D3D12_TEXTURE_ADDRESS_MODE_BORDER，// U 轴 所 用 的 寻 址 模式 (addressU) 
D3D12 TEXTURE ADDRESS MODE BORDER, // Vf j 的 寻 址 模式 (addressV) 


















































D3D12 TEXTURE ADDRESS MODE BORDER, // WwW 的 寻 址 模式 (addressW) 
0.ef, // mipmap 层 级 偏 移 量 (mipLODBias) 

16， // 最 大 各 问 异 性 值 (maxAnisotropy) 

D3D12 COMPARISON FUNC LESS EQUAL, 

D3D12_STATIC BORDER COLOR OPAQUE BLACK); 














注 意 Note 


根据 SDK 文 档 所 述 ， 只 有 R32_FLOAT_X8X24_TYPELESS 格 
式 、R32_FLOAT，R24_UNORM X8_TYPELESS 格 式 与 R16_UNORM 格 式 才 
可 应 用 于 比较 过 滤器 。 


到 目前 为 止 ， 我们 在 本 节 中 一 直 使 用 的 都 是 4-tap PCF 核 (4-tap PCF 
kernel， 即 输入 4 个 样本 来 执行 的 PCF) 。PCF 核 越 大 ， 阴 影 的 边缘 轮廓 
也 就 越 丰满 、 越 平滑 ， 当 然 ， 花 费 在 调用 SampleCmpLeve1Zero 函 数 上 
的 开销 也 就 越 大 。 在 演示 程序 中 ， 我 们 是 按 3 x 3 正方 形 的 过 滤 模 式 来 执 


行 PCF。 由 于 每 次 调用 SampleCmpLevelZero 函 数 实际 所 执行 的 都 是 4- 
tap PCF， 所 以 在 进行 上 述 PCF 的 过 程 中 ， 共 需要 使 用 阴影 图 中 的 4 x 4 个 
独立 采样 点 (根据 我 们 所 用 的 3 x 3 模式 可 知 ， 过 滤 的 过 程 中 会 重复 使 用 
部 分 采样 点 ) 。 有 条 用 过 大 的 过 滤 核 会 导致 之 前 所 述 的 阴影 粉刺 问题 ， 原 
以 及 解决 方案 我 们 将 在 20.5 节 中 展开 讨论 。 











一 个 显而易见 的 事实 是 ，PCEF 技 术 只 需 在 阴影 的 边缘 执行 ， 因 为 阴 
影 内 外 两 部 分 并 不 涉及 混合 操作 《〈 意 即 阴影 内 外 非 黑 即 白 ， 只 有 边缘 才 
是 渐变 的 ) 。 基 于 此 ， 也 就 只 要 能 对 阴影 边缘 的 PCF 设 计 相 应 的 处 理 方 
案 就 好 了 。[Isidoro06b] 指 出 了 这 样 一 种 运用 看 色 器 代码 中 的 动态 分 文 技 
术 :“ 如 条 要 处 理 的 部 分 是 阴影 边缘 就 采用 代价 高 兄 的 PCF 技 术 ， 人 否则 
就 仅 对 一 幅 阴 影 图 进行 采样 。 








要 注意 的 是 ， 如 果 我 们 所 用 的 PCE 核 足够 大 《〈 即 5 x 5 采样 点 及 其 
3 那么 按 上 述 方法 做 才 合 算 《〈 因 为 动态 分 文 也 有 开销 ) 。 但 

， 按 一 般 的 建议 来 讲 ， 我 们 还 是 应 当 根据 具体 需求 在 开销 和 效果 之 间 
0 








注意 ， 实 际 工程 中 所 用 的 PCF 核 未 必 一 定 是 方形 的 过 滤 栅 格 。 不 少 
文献 也 已 指出 ， 随 机 拾取 点 〈randomly picking point) 也 可 作为 PCF 核 。 


20.4.4 构建 阴影 


实现 阴影 贴图 的 第 一 步 焉 是 构建 阴影 图 。 为 此 ， 首 先 需要 创建 一 
个 ShadowMap 实 例 。 


mShadowMap = std: :make_unique<ShadowMap>( 
md3dDevice.Get()，2648，2648 ) ; 


接着 ， 定 义 一 个 光源 观察 窍 阵 以 及 一 个 投影 矩阵 〈 用 来 表示 光源 坐 
标 系 与 视 景 体 ) 。 交 源 观察 矩阵 要 以 主 光 源 的 视角 构建 ， 而 光源 视 景 体 
要 根据 整个 场景 的 包围 球 来 进行 计算 。 











DirectX: :BoundingSphere mSceneBounds; 


ShadowMapApp: :ShadowMapApp (HINSTANCE hInstance) 
: D3DApp (hInstance) 


{ 
// 由 于 我 们 知道 当前 场景 是 如 何 构建 出 来 的 ， 因 此 可 手动 估算 场景 的 包围 球 
// 中 心 位 于 世界 空间 的 原点 ， 且 宽度 为 20， 深 度 为 36.6f 的 栅 格 是 场景 中 “最 宽 的 物体 ”。 
而 在 实际 的 项 
// 目 中 ,我们 阁 要 计算 此 包围 球 ， 通 常 就 需要 裔 历 世 界 空间 中 的 每 个 顶点 的 位 置 
mSceneBounds .Center = XMFLOAT3(6.6f, 8.6f, 86.6ef); 
mSceneBounds .Radius = sqrtf(16.6f*x10.6f + 15.6f*x15.0f) 


} 


void ShadowMapApp::Update(const GameTimer& gt) 


{ 
[...] 










































































// 
// 根据 时 间 的 流逝 动态 调整 各 光源 (以 及 物体 阴影 ) 
// 





mLightRotationAngle += 0.1f*gt.DeltaTime(); 


XMMATRIX R = XMMatrixRotationY(mLightRotationAngle); 

for(int i = 6j i < 3; ++i) 

{ 
XMVECTOR lightDir = XMLoadFloat3(&mBaseLightDirections[i]); 
lightDir = XMVector3TransformNormal(lightDir, R); 
XMStoreFloat3(&mRotatedLightDirections[i], lightDir); 


} 


AnimateMaterials(gt); 
UpdateObjectCBs (gt); 
UpdateMaterialBuffer(gt); 
UpdateShadowTransform(gt); 
UpdateMainpassCB(gt); 


UpdateshadowPassCB(gt) ; 
} 


void ShadowMapApp::UpdateShadowTransform(const GameTimer& gt) 
{ 
// 只 有 第 一 个 “ 主 ” 光 源 才 投 射出 物体 的 阴影 
XMVECTOR lightDir = XMLoadFloat3(&mRotatedLightDirections[0]); 
XMVECTOR lightPos = -2.6f*mSceneBounds.Radius*]lightDir; 
XMVECTOR targetPos = XMLoadFloat3(&mSceneBounds.Center); 
XMVECTOR lightUp = XMVectorset(60.6f, 1.6f, 6.6f, 06.6f); 
XMMATRIX lightView = XMMatrixLookAtLH(lightPos, targetPpos, lightUp); 








XMStoreFloat3(&mLightPposW, lightPos); 








// 将 包围 球 变换 到 光源 空间 

XMFLOAT3 sphereCenterLs ; 

XMStoreFloat3(&sphereCenterLS, XMVector3TransformCoord(targetPos, 
lightView)); 








// 位 于 光源 空间 中 包围 场景 的 正 交 投影 视 景 体 


float 1 = sphereCenterLS.x - mSceneBounds.Radius; 
float b = sphereCenterLS.y - msSceneBounds .Radius ; 
float n = sphereCenterLS.z - mSceneBounds.Radius; 
float r = sphereCenterLS.x + mSceneBounds.Radius; 
float t = SphereCenterLSs.y + msSceneBounds .Radius ; 
float f = sphereCenterLS.z + mSceneBounds.Radius; 


mLightNearZ = n; 
mLightFarz = f; 
XMMATRIX lightProj = XMMatrixOrthographicoffCenterLH(1, r, b, t, n, f); 

















// 将 坐标 从 范围 为 [-1,+1]^2 的 NDC 空 间 变 换 到 范围 为 [6,1]^2 的 纹理 空间 
XMMATRIX T( 

6.5f，6.6f，6.6f，68.6f， 

6.6f，-6.5f，6.6f，68.6f， 

6.6f，6.6f，1.6f，6.6f， 

6.5f，6.5f，6.6f，1.6f); 





XMMATRIX S = lightView*lightProj*T; 
XMStoreFloat4x4(&mLightView, lightView); 
XMStoreFloat4x4(&mLightProj, lightProj); 
XMStoreFloat4x4(&mShadowTransform, S); 





将 场景 演 染 至 阴影 图 要 这 样 实现 : 


void ShadowMapApp: :DrawSceneToShadowMap() 

{ 
mCommandList->RSSetViewports(1, &mShadowMap->Viewport()); 
mCommandList->RSSetScissorRects(1, &mShadowMap->ScissorRect()); 


// 将 资源 状态 改变 为 DEPTH_WRITE 

mCommandList->ResourceBarrier(1, &CD3DX12 RESOURCE BARRIER::Transition( 
mShadowMap->Resource(), 
D3D12 RESOURCE_ STATE_ GENERIC READ, 
D3D12_RESOURCE_ STATE_DEPTH_ WRITE)); 


UINT passCBByteSize = d3dUtil::CalcConstantBufferByteSize(sizeof 
(PassConstants)); 




















// 清理 后 台 绥 冲 区 以 及 深度 缓冲 区 
mCommandList->ClearDepthStencilView(mShadowMap->Dsv(),， 
D3D12 CLEAR FLAG DEPTH | D3D12 CLEAR FLAG STENCIL, 1.6f, 0, 0, nullptr 











); 


// 由 于 仅 向 深度 缓冲 区 绘制 数据 ， 因 此 将 演 染 目标 设 为 空 。 这 样 一 来 将 禁止 颜色 数据 向 泻 
染 目 标的 写 操作 。 

// 注意 ， 此 时 也 一 定 要 把 可 用 《处 于 局 用 状态 ) PSO 中 的 演 染 目标 数量 指定 为 6 

mCommandList->OMSetRenderTargets(9，nullptr，false，&mshadowMap->Dsv() ); 
























































// 为 阴影 图 演 染 过 程 绑 定 所 需 的 常量 绥 冲 区 

auto passCB = mCurrFrameResource->PassCB->Resource( ) ; 

D3D12_ GPU VIRTUAL ADDRESS passCBAddress = passCB->GetGPUVirtualAddress() 
+ 1*passCBByteSize; 

mCommandList->SetGraphicsRootConstantBufferView(1, passCBAddress); 

















mCommandList->SetpipelineState(mpSOs["shadow opaque"].Get()); 


DrawRenderItems(mCommandList.Get(), mRitemLayer[(int)RenderLayer::0Opaque 
]); 


// 将 资源 状态 改变 回 GENERIC_READ， 使 我 们 能 够 从 着 色 器 中 读 取 此 纹理 
mCommandList->ResourceBarrier(1, &CD3DX12 RESOURCE BARRIER::Transition( 
mShadowMap->Resource(), 
D3D12 RESOURCE STATE DEPTH WRITE, 
D3D12_ RESOURCE STATE GENERIC READ)); 





























可 以 看 出 ， 我 们 在 这 里 设置 了 一 个 空 的 泻 染 目标 ， 其 实 束 是 禁止 了 
颜色 数据 的 写 操作 。 这 样 做 的 原因 是 在 将 场景 泻 染 至 阴影 图 时 ， 我 们 只 


关心 相对 于 光源 的 场景 深度 值 。 显 卡 针对 仅 绘制 深度 数据 的 情况 进行 了 
优化 ， 因 此 仅 绘 制 深度 值 的 泻 染 过 程 明 显要 快 于 同时 绘制 颜色 数据 与 深 
度 值 的 泻 染 过 程 。 此 时 ， 我 们 也 必须 将 处 于 活动 状态 的 流水 线 状态 对 象 
的 泻 染 目标 个 数 指定 为 0。 





D3D12 GRAPHICS PIPELINE STATE DESC smapPsoDesc = opaquePsoDesc ; 
smapPsoDesc.RasterizerState.DepthBias = 16066080; 
smapPsoDesc.RasterizerState.DepthBiasClamp = 6.6f; 
smapPsoDesc.RasterizerState.SlopeScaledDepthBias = 1.6f; 
smapPsoDesc.pRootSignature = mRootSignature.Get(); 
smapPsoDesc.VS = 
{ 
reinterpret cast(mShaders["shadowVS"]->GetBufferPointer()), 
mShaders["shadowVS"]->GetBufferSize() 
}; 
smapPsoDesc.PS = 
{ 
reinterpret cast(mShaders["shadowOpaquePS"]->GetBufferPpointer()), 
mShaders["shadowOpaquePS"]->GetBufferSize() 


}; 
// 阴影 图 的 泻 染 过 程 无 须 涉及 泻 染 目标 











smapPsoDesc.RTVFormats[6] = DXGI_ FORMAT UNKNOWN; 

smapPsoDesc .NumRenderTargets = 0@; 

ThrowIfFailed(md3dDevice->CreateGraphicsPipelinestate( 
&smapPsoDesc, IID PPV ARGS(&mPpSOs["shadow opaque" |]))); 








以 光源 的 视角 泻 染 场景 的 着 色 器 程序 十 分 简单 ， 这 是 因为 只 需 构建 
阴影 图 即 可 ， 所 以 也 惑 用 不 到 那些 复杂 的 代码 。 
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// Shadows .hlsl 的 作者 是 Frank Luna (C) 2615 版 权 所 有 


PAY Bs est tts dt ee ee 























// 包含 公用 的 HLSL 代 码 


#include "Common.hlsl" 





struct VertexIn 


{ 
float3 PosL : POSITION; 


float2 TexC : TEXCOORD ; 
}; 


struct VertexOut 


{ 
float4 PosH : SV_POSITION; 


float2 TexC : TEXCOORD; 
}; 
VertexOut VS(VertexIn vin) 
{ 
VertexOut vout = (VertexOut)0.ef; 


MaterialData matData = gMaterialData[gMaterialIndex]; 














// 将 顶点 变换 到 世界 空间 
float4 posW = mul(float4(vin.PosL, 1.6f), gWorld); 














// 将 顶点 变换 至 齐 次 裁剪 空间 
vout .PosH = mul(posW, gViewpPro]j); 








一 汪 


// 为 三 角形 插值 而 输出 项 点 属性 
float4 texC = mul(float4(vin.TexC, 8.6f, 1.6f), gTexTransform); 
vout.TexC = mul(texC, matData.MatTransform) .xy; 























return vout; 


} 


// 这 段 代 码 仅 用 于 需要 进行 alpha 裁 剪 的 几何 图 形 ， 以 此 使 阴影 正确 地 显现 出 来 

// 如 果 待 处 理 的 几何 图 形 无 须 执 行 此 操作 ， 则 可 以 在 深度 渲染 过 程 中 使 用 无 内 容 Cnul1) 的 
像素 着 色 需 

void PS(VertexOut pin) 

{ 
























































// 获取 材质 数据 
MaterialData matData = gMaterialData[gMaterialIndex]; 
float4 diffuseAlbedo = matData.DiffuseAlbedo 

uint diffuseMapIndex = matData.DiffuseMapIndex; 











ii 














// 在 数组 中 动态 地 查找 纹理 
diffuseAlbedo *= gTextureMaps[diffuseMapIndex] . 
Sample(gsamAnisotropicWrap, pin.TexC); 


#ifdef ALPHA_TEST 
// 如 果 像 素 的 alpha 值 < 6.1, 丢弃 该 像素 。 我 们 应 在 着 色 器 中 尽早 执行 这 项 测试 ， 以 使 
满足 条 件 的 
// 像素 尽早 地 退出 着 色 器 ， 以 此 来 跳 过 没 必 要 执行 的 后 续 代 码 
clip(diffuseAlbedo.a - 6.1f); 
#endif 




















站 
可 以 看 出 像素 着 色 韦 并 没有 返回 任何 数据 ， 这 是 因为 在 深度 绘制 过 
程 中 只 需 输出 深度 值 即 可 。 其 间 ， 像 素 着 色 器 仅 用 于 裁剪 具有 0 或 较 小 
alpha 值 的 像 双 片段， 我们 假设 这 种 像 系 片段 都 是 完全 透明 的 。 以 图 
20.14 中 的 树叶 纹理 为 例 。 在 此 ， 我 们 只 希望 将 具有 白色 alpha 值 的 像 系 
绘制 到 阴影 图 中 。 为 了 实现 此 目标 ， 我 们 将 其 划分 为 两 种 情况 : 一 种 是 
需要 执行 alpha 裁 甬 (alpha clip) 操作 的 ， 另 一 种 则 不 需要 此 操作 。 如 宋 














竺 处 理 的 几何 图 形 不 需要 执行 apha 裁 蚤 ， 那 么 我 们 就 可 以 给 它 绑 定 一 个 
空 的 像素 着 色 需 ， 这 样 一 来 ， 其 执行 速度 将 快 于 绑 定 上 述 像素 肴 色 露 
〈 此 着 色 器 仅 对 一 种 纹理 进行 采样 还 要 进行 裁 甬 操作 的 ) 的 情况 。 


(六 





é 


图 20.14 ”叶片 纹理 


注 意 Note a 


考虑 到 篇 幅 问 题 ， 我 们 仅 对 经 镶 骨 化 处 理 的 几何 体 泻 染 深 度数 据 的 
着 色 器 做 简要 分 析 。 在 将 镶 庶 化 处 理 后 的 几何 体 绘制 到 阴影 图 的 时 候 ， 


我 们 也 需要 按 同 样 的 镶 骨 方式 对 该 几何 体 进行 镶 杠 化 处 理 ， 再 将 其 绘制 
到 后 台 绥 冲 区 〈 即 根据 玩家 的 观 凤 点 到 该 几何 体 的 距离 对 它 进行 给 
制 )》 。 这 样 做 的 原因 是 为 了 保持 一 致 性 ， 即 从 观察 者 视角 查看 的 几何 体 
应 当 与 光源 视角 观 穴 的 几何 体 相 同 。 话 虽 如 此 ， 但 如 果 灸 嵌 化 几何 体 的 
形状 变化 不 太 大 ， 那 么 这 些 改变 也 不 太 能 在 阴影 中 得 到 体现 。 因 此 ， 一 
种 可 能 的 优化 方式 是 ， 在 演 染 几何 体 的 阴影 图 时 ， 不 必 对 几何 体 进行 镶 
嵌 化 处 理 。 此 优化 要 考虑 精度 与 速度 的 取 合 。 











20.4.5 ”阴影 因子 


阴影 因子 〈shadow factor) 是 我 们 为 光照 方程 新 添加 的 一 种 范围 在 
[0, 1] 的 标量 系数 。 其 值 为 0， 表 示 位 于 阴影 中 的 点 ; 值 为 1， 则 代表 此 点 
在 阴影 之 外 。 在 进行 PCF (20.4.3 节 )〉 时 ， 一 个 点 可 能 会 部 分 处 于 阴影 
之 中 ， 在 这 种 情况 下 ， 阴 影 因 子 将 位 于 0 一 1。CalcSshadowFactor 〈 计 
算 阴 影 因 子 ) 函数 的 实现 位 于 Common.hlsl 文 件 之 中 。 














float CalcShadowFactor(float4 shadowPosH) 


{ 
// 通过 除 以 w 来 实现 投影 变换 
shadowPosH.xyz /= shadowPosH.w; 


// ”NDC 空间 中 的 深度 值 
float depth = shadowPosH.z; 


uint width, height, numMips; 
gShadowMap .GetDimensions(8@, width, height, numMips); 


// 纹 素 的 大 小 
float dx = 1.6f / (float)width; 


float percentLit = 6.6f; 

const float2 offsets[9] = 

{ 
float2(-dx, -dx), float2(68.6f, -dx), float2(dx, -dx), 
float2(-dx, 8.6f), float2(6.6f, 8.6f), float2(dx, 8.6f), 
float2(-dx, +dx), float2(68.6f, +dx), float2(dx, +dx) 


}; 


[unroll] 
for(int i = 6; i «< 9; ++i) 
{ 
percentLit += gShadowMap.SampleCmpLevelZzero(gsamShadow, 
shadowPosH.xy + offsets[i], depth).r; 


} 


return percentLit / 9.6f; 








在 我 们 所 用 的 模型 中 ， 阴 影 因 了 于 将 与 直接 光照 〈 漫 反射 光 与 镜面 反 
财 光 ) 项 相 乘 。 








// 只 有 第 一 个 光源 才 投 恬 物 体 阴 影 
float3 shadowFactor = float3(1.6f，1.6f，1.6f); 
shadowFactor[6] = CalcshadowFactor(pin.SshadowPosH) ; 


const float shininess = (1.6f - roughness) * normalMapSample.a; 

Material mat = { diffuseAlbedo, fresnelR@, shininess }; 

float4 directLight = ComputeLighting(gLights, mat, pin.PoskW, 
bumpedNormalW, toEyeW, shadowFactor); 


float4 ComputeLighting(Light gLights[MaxLights], Material mat， 
float3 pos, float3 normal, float3 toEye, 
float3 shadowFactor) 


{ 
float3 result = 60.60f; 


int i = ©; 


#if (NUM DIR_ LIGHTS > 9) 
for(i = 6; i < NUM DIR LIGHTS; ++i) 
{ 
result += shadowFactor[i] * ComputeDirectionalLight(gLights[i], 
mat, normal, toEye); 


} 


#endif 


#if (NUM POINT_LIGHTS > 6) 
for(i = NUM DIR LIGHTS; i < NUM DIR LIGHTS+NUM POINT_ LIGHTS; ++i) 


{ 
result += ComputepointLight(gLights[i], mat, pos, normal, toEye); 


} 
#endif 


#if (NUM SPOT_LIGHTS > 96) 
for(i = NUM DIR LIGHTS + NUM POINT LIGHTS; i < NUM DIR LIGHTS + 
NUM_POINT_LIGHTS + NUM SPOT_LIGHTS; ++i) 


{ 
result += ComputeSpotLight(gLights[i], mat, pos, normal, toEye); 


} 
#endif 


return float4(result, 86.6f); 
} 








由 于 环境 光 是 间接 光 ， 所 以 阴影 因子 不 会 对 它 产 生 影 响 。 而 且 ， 阴 
影 因 子 也 不 会 对 来 自 环 境 图 (environment map) 的 反射 光 构成 影 啊 。 


20.4.6 ”阴影 图 检测 


通过 以 光源 的 视角 泻 染 场 景 来 构建 阴影 图 之 后 ， 我 们 就 可 以 在 主演 
染 过 程 中 对 阴影 图 进行 采样 ， 以 确定 某 像素 是 否 位 于 阴影 之 内 。 问 题 的 
关键 在 于 为 每 个 像素 P 都 要 计算 dp) 与 WP)。 把 点 变换 到 光源 的 NDC 空 间 
便 可 以 求 出 其 对 应 的 dp) 值 ， 此 时 ， 该 点 的 > 坐标 即 为 此 点 位 于 光源 空间 
中 的 归 一 化 深度 值 。 在 光源 的 视 景 体 中 运用 投影 纹理 贴图 技术 ， 投 影 出 
场景 的 阴影 图 就 可 以 求 出 值 sp)。 注 意 ， 在 进行 这 一 系列 操作 之 后 ，d(P) 
与 5(P) 都 将 被 表示 在 光源 的 NDC 空 间 之 中 ， 因 此 它们 就 可 以 直接 展开 比 
较 。 再 利用 变换 矩阵 gSshadowTransform 便 可 以 将 坐标 由 世界 空间 变换 








到 阴影 图 纹理 空间 〈 人 参见 20.3 节 ) 。 














// 在 顶点 着 色 器 中 ， 为 场景 阴影 图 而 生成 的 投影 纹理 坐标 


vout .ShadowPosH = mul(posW, gShadowTransform); 

















// 在 像素 着 色 器 中 执行 明 影 图 检测 
float3 shadowFactor = float3(1.6f, 1.6f, 1.6ef); 
shadowFactor[6] = CalcShadowFactor(pin.ShadowPosH); 








中 。 
20.4.7 泻 染 阴影 图 


在 本 章 的 演示 程序 中 ， 我 们 也 将 阴影 图 泻 染 在 了 屏 磊 右 下 角 的 四 边 
形 之 中 。 从 该 图 中 ， 我 们 可 以 观察 到 阴影 图 在 每 一 帧 中 的 变化 。 前 面 曾 
讲 过 ， 阴 影 图 其 实 是 一 种 深度 缓冲 区 纹理 ， 我 们 可 以 为 它 创 建 一 个 
SRV《〈 着 色 器 资源 视图 ) ， 以 便 在 着 色 器 程序 中 对 它 进行 采样 。 由 于 阴 
影 图 中 每 个 像素 存储 的 都 是 一 个 一 维 数据 《〈 即 一 个 深度 值 ) ， 所 以 我 们 
将 它 泻 染 为 一 幅 灰 度 图 像 。 图 20.15 所 示 的 是 一 张 *<Shadow Map”《〈 阴 影 
图 ) 演示 程序 的 效果 。 





司 did app tpi: OVUWVWY mspt: lobotebb = 











图 20.15 ”阴影 图 例 程 的 效果 


20.5 “过 大 的 PCE 核 


在 本 市 中 ， 我 们 将 讨论 使 用 过 大 的 PCEF 核 所 引发 的 问题 。 我 们 在 演 
示 程 序 中 所 用 的 PCF 核 不 是 很 大 ， 所 以 这 一 市 在 茶 种 意义 上 来 说 是 选 学 
内 容 ， 但 是 在 此 会 接触 到 一 些 有 趣 的 套路 。 








图 20.16 所 示 的 是 我 们 为 观察 点 可 见 像 系 P 执 行 阴 影 检 测 的 计算 过 
程 。 如 果 没 有 使 用 PCF 技 术 ， 就 计算 距离 4 = dpP)， 并 将 它 与 相应 的 阴影 
图 数据 % = stp) 进 行 比较 ， 若 采用 PCF 技 术 ， 我 们 还 应 令 d 与 附近 的 纹理 
图 数据 5-1 与 51 进行 比较 。 但 是 ， 使 4 分 别 与 5-1 和 51 进行 比较 其 实 是 不 合 
理 的 ， 这 是 因为 纹 素 5-1 与 和 4 所 描述 深度 值 的 场景 区 域 有 可 能 与 ?所 在 的 
多 边 形 并 不 相同 。 








偏 移 后 场景 中 的 多 边 形 


被 偏 移 的 多 边 形 


图 20.16 令 深 度 值 4(P) 与 50 进 行 比较 是 正确 的 ， 因 为 纹 素 50 所 覆盖 的 场景 区 域 必然 包括 像素 了 
。 然 而 ， 使 dj) 分 别 与 s-1 和 51 进行 比较 却 是 错误 的 ， 这 是 因为 5- ! 与 s1 履 盖 的 场景 区 域 与 像素 
P 无 关 





























图 20.16 所 示 的 情景 就 是 一 宗 由 PCF 引 起 的 误 判 。 特 别 是 在 我 们 进行 
以 下 阴影 图 检测 的 时 候 : 





lito =d < =0 ( 真 ) 
lt_1 一 以 入 5S 1 ( 真 ) 
liti = dg s1 ( 假 》 


如 果 按 这 个 检测 结果 进行 插值 ， 我 们 将 得 到 点 P 的 /3 位 于 阴影 中 这 
一 错误 的 结论 ， 而 实际 上 点 2 根本 没有 被 任何 东西 遮挡 住 。 


观察 图 20.16 可 知 ， 若 将 深度 偏 移 量 增 大 便 可 修正 这 个 问题 。 然 

， 在 这 个 示例 中 ， 我 们 只 能 对 阴影 图 中 邻近 ee 如 果 我 
们 继续 扩大 PCF 核 ， 那 么 很 可 能 还 需要 继续 增 大 偶 移 量 。 总 的 来 讲 ， 针 
对 小 的 PCF 核 来 说 ， 只 需 像 20.4.2 节 中 介绍 的 那样 ， A 
移 便 可 以 无 后 顾 之 忧 地 解决 该 问题 。 而 对 于 像 5 x 5 或 9 x 9 这 样 规模 较 大 
的 PCF 核 来 说 ， 虽 然 确实 可 以 生成 过 渡 更 加 自然 的 软 阴影 (soft 
shadow， 和 柔和 阴影 ) ， 但 同时 也 可 能 引起 一 些 严重 的 问题 。 











20.5.1 ddx 函 数 与 ddy 函 数 








在 研究 较 大 PCF 核 问题 的 解决 方案 之 前 ， 首 Ge 
PO 数 。 它 们 分 别 近 ei ed 97 与 9p/y 的 值 ， 其 中 ， 
指 屏幕 空间 的 z 轴 ，VY 则 为 屏幕 空间 的 y 轴 。 有 了 这 两 种 函数 ， 我 们 便 可 
Ce 例如 ， 这 两 个 导 函 数 可 以 用 








1. 估算 相 邻 像素 的 颜色 变化 量 。 





2. 估算 相 令 像素 的 深度 变化 量 。 
3. 估算 相 邻 像素 的 法 线 变 化 量 。 


人 硬件 估算 这 些 俩 导数 的 过 程 并 不 复杂 。 它 会 按 2 x 2 像 系 规模 的 四 边 
形 进 行 并 行 处 理 ， 以 前 向 差分 方程 +ly ”生来 估算 z 方 向 上 的 俩 导数 
( 即 估 算 由 像素 (7,Y) 到 像素 (7 +1,y) 的 变化 量 9) ， 并 以 类 似 的 方法 来 计 
算 y 方 向 上 的 侦 导 数 。 





20.5.2” 较 大 PCF 核 问题 的 解决 方案 


本 节 所 描述 的 方案 来 自 于 [Tuft10]。 该 策略 需要 满足 的 前 提 是 假设 P 
与 其 相 邻 像素 位 于 同一 平面 之 内 。 实 际 应 用 中 未 必 处 处 满足 此 条 件 ， 但 
征 右 依 此 方案 解决 问题 ， 节 好 还 是 如 前 提 条 件 所 述 。 











设 P = (wv, 3) 为 光源 空间 中 的 坐标 ， 华 标 (w,") 用 于 索引 阴影 图 ，s 值 
则 表示 阴影 图 检测 过 程 中 所 用 的 光源 到 该 点 的 距离 。 我 们 可 以 用 ddx 
与 ddy 这 两 个 函数 来 分 别 计算 位 于 多 边 形 所 在 切 平面 内 的 向 量 











Op 人 om ) Op (¥ Ou 7 ) 

Or \QOr’' or'or 与 向 量 必 NO Ov OV/ 此 两 个 向 量 反 映 了 在 屏幕 
空间 与 推算 光源 空间 里 移动 中 的 单位 对 应 关系 。 特 别 地 ， 如 果 我 们 在 屏 
幕 空 间 中 移动 了 (27, 人 YW) 个 单位 ， 那 么 在 光源 空间 中 应 按 切 向 量 方向 对 




















(2 OU 3 A (¥ Ou 二 
T a 1 rp 
应 地 移动 ”如 E907/ 好 "By' 9/ 个 单位 。 在 此 ， 我 们 先 暂时 
忽略 深度 项 ， 如 果 在 屏幕 空间 中 移动 了 (人 27; 分 ) 个 单位 ， 则 应 在 光源 空 
a (¥ 当 (S ) 
y _ A La CA ed 和 
间 的 wv 平面 内 对 应 地 移动 Or 1 dy 0y/ 个 单位 。 这 个 操作 
可 由 下 列 矩 阵 方程 来 表示 : 
Gu UU Ou On Ou Ou 
[Az, A 区 一 AT ( 芝 ) + AYy (% 2 ) = [Au, Adl 
By Wy Or Or Oy Oy 


因此 


du 
dy dy 


Qu du = 
[Az, Ay| = [Au, Au] 区 | 


1 也 加 
有 [Au AU] dy UI 
) Ou yu OuBu |_ du Ou 


BT 太 ”8I 上 上 有 弘 拭 


(20.1) 


回顾 第 2 章 介绍 的 内 容 可 知 : 


All! A12 用 ] A 一 -412 
421 42| .414 一 -442 | 一 4342 40 





这 个 新 推导 的 方程 反映 出 ， 如 宁 在 光源 空间 中 的 wo 税 面 内 移动 了 
(au 人 A) 个 单位 ， 那 么 在 平面 空间 中 则 移动 了 (A7; AA) 个 单位 。 我 们 为 什 





么 要 在 式 〈20.1) 上 花费 这 么 多 时 间 呢 ? 这 是 因为 在 构建 PCF 核 时 ， 我 
们 需要 偏 移 纹理 坐标 来 采集 阴影 图 中 目标 点 的 邻近 数据 。 








// 纹 素 的 大 小 
float dx = 1.6f / (float)width; 


float percentLit = 60.6f; 
Const float2 offsets[9] = 


float2(-dx，-dx)，float2(6.6f，-dx)，float2(dx，-dx)， 
float2(-dx，6.6f)，float2(6.6f，6.6f)，float2(dx，6.60f)， 
float2(-dx，+dx)，float2(6.6f，+dx)，float2(dx，+dx) 


}; 


// 3x3 的 方形 过 滤器 模式 。 每 个 样本 要 执行 一 次 4-tap PCF 操 作 
[unroll] 
for(int i = 6;j i < 9; ++i) 


{ 





percentLit += gShadowMap.SampleCmpLevelZero(gsamShadow, 
shadowPosH.xy + offsets[i], depth).r; 








换 句 话说 ， 我 们 就 相 当 于 知道 了 〔 对 应 于 屏幕 空间 的 ) 光源 空间 中 
uv 平面 内 的 偏 移 量 一 一 (人 Au 人 0)。 从 式 (20.1) i 如 果 在 光源 


空间 中 移动 了 ”Au ”JW 个 单位 ， 那 么 在 屏幕 空间 中 移动 的 单位 势必 为 
(Az, AY), 

















现在 重新 来 考虑 前 面 忽 略 的 深度 项 。 如 下 我 们 在 屏幕 空间 中 移动 了 
te”y) 个 单位 ， 那 么 就 会 在 光源 空间 中 的 深度 方向 移动 





Oz O02 
AZzZ= AToo—+AYyo— 、、,、 ee _ pm 、 
Or 0y。 这 样 一 来 ， 当 偏 移 纹理 坐标 来 执行 PCF 操 作 时 ， 我 
们 束 该 相应 地 修改 深度 值 2 = :+ 、z 来 进行 深度 检测 〈 见 图 20.17) 。 


下 面 我 们 来 总 结 一 下 较 大 PCF 核 的 处 理 思 路 : 


.在 实现 PCF 的 过 程 中 ， 我 们 会 通过 偏 移 纹 理 坐 标 来 采集 阴影 图 


中 目标 点 的 邻近 的 数据 。 因 此 ， 对 于 每 个 样本 来 说 ， 我 们 知道 其 偏 移 量 


(Au, AV), 


2， 借 助 式 (20.1) 便 可 以 求 出 在 光源 空间 中 偏 移 (A Au) 个 单位 
时 ， 屏 幕 空间 中 的 相应 偏 移 量 (Az, AY)。 


:> Oz 
Az 一 AT 一 十 


_ 2 ; AYS— ,i 
. 解 得 (7, AY) 之 后 ， 我 们 就 能 运用 OT 0y 来 求 出 光 
源 空间 中 的 深度 变化 量 。 
SDirectX 11 SDK 中 的 “CascadedShadowMaps11” 演 示 程 序 就 是 以 


CalculateRightAndUpTexel- DepthDeltas 函 数 
与 CalculatePCFPercentLit 消 数 实现 了 上 述 方法 。 






-2 = (u + Au,z+ Az) 
偏 移 后 场景 中 的 多 边 形 
被 偏 移 的 多 边 形 











图 20.17 ”为 简单 起 见 ， 这 里 展示 的 是 2D 示 意图 。 如 果 用 Au 令 P = (2; >) 在 方向 u 上 进行 偏 














移 ， 并 得 到 (4 十 和 Au; >)， 那 么 ， 我 们 还 需要 以 人 2 对 > 坐标 进行 偏 移 ， 使 该 点 仍 处 于 多 边 
上 ， 这 将 得 到 P' = (W 十 入 u,z 十 人 z) 








形 之 


20.5.3” 较 大 PCE 核 问题 的 万 一 种 解决 方案 





本 市 介绍 的 方 采 出 自 于 [Isidoro06]， 这 是 一 种 与 前 一 节 中 所 述 的 方 
法 稍 有 不 同 的 改 民 方案 的 计算 方法 。 

设 P = (wv,3) 为 光源 空间 中 的 坐标 。 举 标 (w,") 用 于 对 阴影 图 进行 索 
引 ，z 值 则 表示 阴影 图 检测 过 程 中 光源 全 该 点 的 距离 。 我 们 可 以 用 函 








| 
数 ddx 与 ddy 计 算 97 下 红 好 07J5SOy \0y dy 0 /。 
事实 上 ， 我 们 可 以 把 式 中 的 偏 导数 表示 为 "= 7; 罗 、v = v7 与 
> 二 27) 功 这 些 自 变量 为 r、Y 的 函数 。 而 且 ， 也 可 以 把 z 看 作 是 自 变量 为 " 
、v 的 函数 ， 即 2 = :tu 岂 。 这 是 因为 我 们 在 光源 空间 中 是 按 v 与 v 的 方向 
进行 移动 ， 所 以 深度 :是 在 沿 着 多 边 形 所 在 平面 移动 的 过 程 中 而 产生 变 
化 的 。 根 据 链 式 法 则 (chain rule) ， 有 : 


Oz OzOu ozon 














or OQudr Dar 
Oz 四 OzOu ozon 


Oy udy hy 





或 者 用 矩阵 表示 法 记 作 : 





根据 矩阵 的 逆 ， 可 将 公式 变换 为 : 








长 | n 

dr dy Wy oy 

| 
JdI Oy dy UI 


Oz Oz 


现在 就 己 经 直接 求 出 了 弛 与 (等 式 右 侧 的 所 有 内 容 都 是 已 知 
x 间 中 的 wo 平面 内 移动 了 (Auw Au 个 单位 ， 则 光源 空 








的 ) 。 如 果 在 光源 空 
Oz ,0 
间 的 深度 值 应 相应 地 移动 ~ | ‘Bu 
因此 ， 如 果 采 用 这 J a 空间 ， 而 
ns 





是 使 它们 一 直 保 持 在 光源 空 
我 们 就 能 直接 指出 深度 值 的 变化 情况 。 而 根据 前 一 
屏幕 空间 中 z 与 y 坐 标的 改变 而 求 出 具体 的 深度 值 。 


节 中 所 述 的 方案 ， 我 


们 却 只 能 随 


20.6 ”小 结 


1. 洽 染 目标 并 非 后 台 缓 冲 区 的 专利 ， 我 们 还 可 以 将 数据 泻 染 至 男 
一 种 与 之 不 同 的 纹理 之 中 。 泻 染 到 纹理 搁 术 为 GPU 动 态 更 新 纹理 的 内 容 
提供 了 一 种 高 效 的 方式 。 在 将 数据 泻 染 到 一 个 纹理 之 后 ， 我 们 就 可 以 将 
此 纹理 绑 定 为 着 色 器 的 输入 ， 并 将 其 映射 到 几何 体 之 上 。 演 染 到 纹理 技 
术 可 以 广泛 地 应 用 到 多 种 特效 之 中 ， 像 阴影 图 、 水 体 仿真 以 及 GPU 通用 
编程 技术 。 











2. 如 宁 采 用 正 交 投影 技术 ， 则 视 景 体 便 是 一 个 宽度 为 w、 高 度 为 n 
、 近 平面 为 "而 远 平 面 为 1 的 长 方 体 ， 并 且 投 影 线 彰 平 行 于 观察 空间 中 的 
: 轴 。 这 种 投影 主要 用 于 3D 科 学 程序 或 工程 应 用 之 中 ， 这 几 种 领域 大 多 
期 望 在 投影 之 后 平行 线 继续 保持 平行 “而 不 像 是 透视 投影 那样 汇 于 灭 
点 ) 。 本 章 的 例 移 就 是 通过 正 交 投影 来 模拟 平行 光 所 生成 的 阴影 。 




















3. 投影 纹理 贴图 的 称谓 来 源 于 这 种 技术 可 以 使 我 们 将 纹理 投影 到 
任意 的 几何 体 之 上 ， 这 一 过 程 就 如 同 投影 机 的 工作 原理 。 投 影 纹 理 贴图 
的 关键 在 于 为 每 个 像素 生成 相应 的 纹理 坐标 ， 使 该 纹理 看 上 去 似乎 是 投 
射 到 了 目标 几何 体 之 上 。 这 种 纹理 坐标 被 称 为 投影 纹理 坐标 〈projective 
texture coordinate) 。 我 们 先 通过 将 像素 投射 到 投影 机 的 投影 平面 ， 而 
后 再 将 它 映 射 到 纹理 坐标 系 内 ， 以 此 获取 其 相应 的 投影 纹理 坐标 。 








4. 阴影 贴图 是 一 种 将 阴影 投 册 在 任意 几何 体 〈 即 不 仅 限于 平面 阴 
影 ”》 上 的 实时 阴影 演 染 技术 。 阴 影 贴图 的 思路 是 以 光源 视角 将 场景 的 深 





度 信息 泻 染 至 阴影 图 中 。 这 样 一 来 ， 阴 影 图 将 存 有 从 光源 角度 来 看 的 可 
ww 随后 ， 我 们 从 摄像 机 的 视角 再 泻 染 一 所 场景 ， 并 使 用 

役 影 纹理 贴图 技术 将 阴影 图 投射 到 场景 之 中 。 设 5(P) 为 从 阴影 图 投射 到 
像素 P 的 深度 值 ，d(p) 为 从 光源 到 该 像素 的 深度 ， 那 么 ， 如 果 dlp) > stp) 
， 则 像素 P 位 于 阴影 之 中 。 即 如 果 像 素 的 深度 值 4lP) 大 于 该 像素 的 阴影 
投 里 深度 szP)， 则 在 光源 至 像素 P 这 条 路 径 中 ， 必 存在 一 像素 更 接近 于 光 
源 并 遮挡 住 像素 P， 因 此 z 将 被 投 映 在 阴影 之 中 。 











5. 使 用 阴影 图 最 让 人 头疼 的 问题 就 是 走样 。 阴 影 图 存储 的 是 以 光 
源 视 角 来 看 距离 其 最 近 的 可 见 像素 的 深度 值 。 只 可 惜 阴 影 图 的 分 辨 座 有 
限 ， 因 此 每 个 阴影 图 纹 素 都 对 应 于 场景 中 的 一 块 区 域 。 因 此 ， 阴 影 图 仅 

一 种 从 光源 角度 看 去 场景 深度 的 离散 采样 。 这 会 导致 像 阴 影 粉 刺 
(shadow acne) 这 种 知名 的 图 像 混 车 问 题 。 采 用 图 形 硬件 内 部 支持 的 斜 
紊 缩放 偏 移 (slope-scaled-bias， 可 在 光栅 化 演 染 状态 属性 
D3D12_RASTERIZER_DESC 之 中 设置 此 功能 ) 技术 修正 阴影 粉刺 是 一 
种 常用 的 策略 。 阴 影 图 有 限 的 分 辩 京 也 会 导致 明 影 边缘 的 锯齿 问题 。 对 
此 ，PCF 是 一 种 比较 流行 的 解决 方案 。 除 此 之 外 ， 用 于 解决 走样 问题 的 
高 级 方案 还 有 级 联 明 影 图 (cascaded shadow map) 与 方 过 阴影 图 


(variance shadow map) 等 。 

















20.7 练习 











1. 编写 一 个 程序 ， 尝 试 通过 透视 投影 与 正 交 投影 两 种 方式 分 别 将 
纹理 投影 到 场景 之 中 ， 从 而 来 模拟 投影 机 的 工作 效果 。 





， 修改 前 一 个 练习 的 答案 ， 在 程序 中 使 用 纹理 寻 址 模式 ， 从 此 令 
投影 机 视 景 体 之 外 的 点 不 受 光 照 。 


3. 修改 练习 1 的 答 采 ， 采 用 聚光灯 作为 投影 机 的 光源 ， 信 此 令 聚 光 
灯 圆 锥 体 照 射 范 围 之 外 的 点 不 会 被 投影 机 发 出 的 光照 射 到 。 


4， 以 透视 投影 代 华 本章 演示 程序 中 的 投影 方式 。 需 要 注意 的 是 ， 
虽然 糙 率 缩放 偶 移 技术 可 应 用 于 正 交 投影 ， 但 对 透视 投影 来 说 效果 却 不 
是 很 好 。 在 使 用 透视 投影 时 能 够 发 现 深度 图 因 过 度 侦 移 而 转 为 白色 
(1.0) 。 试 根据 图 5.25 所 示 的 曲线 图 对 此 现象 做 出 解释 。 





5。 党 试 4096 x 4096、1024 x 1024、512 x 512 和 256 x 256 这 几 种 不 同 
分 辩 率 的 阴影 


6. 试 推导 出 可 以 实现 |/; 沁 1 x lb,t x In, fj 二 [-1,1] x [1,1] x [0,1] 的 长 
方 体 映射 矩阵 。 得 到 的 将 是 一 种 “偏离 中 心 ”(off center) 的 正 交 视 景 体 
《 即 此 长 方 体 的 中 心 点 不 在 观察 空间 的 原点 处 ) 。 相 对 地 ，20.2 节 中 所 
推导 出 的 正 交 投影 矩阵 变换 得 到 的 是 一 种 “位 于 中 心 ”(on center) 的 正 
区 视 景 体 。 





7. 在 第 17 章 中 ， 我 们 曾 学 习 过 一 种 与 拾取 技术 相关 的 透视 投影 矩 
阵 。 现 在 试 为 “偏离 中 心 ”的 正 交 投影 推导 相应 的 拾取 公式 。 





8. 试 以 单 次 点 采样 阴影 检测 来 修改 “Shadows”( 阴 影 ) 演示 程序 
( 即 不 采用 PCF)〉。 我 们 将 欣赏 到 人 硬 阴影 (hard shadow) 与 锯齿 状 的 阴 
影 边 缘 。 





9. 关闭 矢 率 缩放 偶 移 来 观察 阴影 粉刺 。 








10. 将 斜 率 缩放 偏 移 值 修 改 为 极 大 的 偏 移 量 ， 以 此 来 观察 peter 
panning 失 真 的 效果 。 





11. 正 交 投影 可 用 于 为 方 癌 光 光源 生成 阴影 图， 而 透视 投影 可 为 聚 
光 灯 光源 生成 阴影 图 。 试 解释 怎样 借助 立方 体 图 (cube map ) 与 6 个 视 
场 角 为 99”〈 水 平视 场 角 与 垂直 视 场 角 缘 为 90") 的 透视 投影 来 生成 反光 
源 的 阴影 图 。 


提示 


(请 回顾 第 18 章 动态 中 立方 体 图 的 生成 过 程 》 思 考 怎 样 通 过 立方 体 
图 来 进行 阴影 图 检测 。 

















[1] 也 有 译作 混 登 、 锯 齿 等 。 我 这 里 为 了 根据 视觉 效果 分 类 ， 更 倾 问 把 
图 像 中 的 波纹 作 泥 对 a 言 号 处 理 方面 ， 这 里 为 区 分 走 
样 效 果 而 作 ) 、 边 缘 称 锯 齿 ， 总 称 走样 。 








第 21 音 ”环境 光 遮 贡 


由 于 性 能 的 限制 ， 实 时 光照 模型 往往 会 忽略 间接 光 因 素 〈 即 场景 中 
其 他 物体 所 反弹 的 光线 ) 。 但 在 现实 生活 中 ， 大 部 分 光照 其 实 是 间接 
光 。 在 第 8 章 中 ， 我 们 为 光照 方程 引入 了 环境 光 项 : 


ca = AL® md 


颜色 4z 表 示 的 是 从 茶 光 源 发 出 ， 经 环境 反射 而 照射 到 物理 表面 的 
间接 光 《 即 环境 光 ) 总 量 。 漫 反射 反照 率 ma 则 指出 了 物体 表面 根据 温 
反射 率 将 入 射 光 反射 回 的 总 量 。 所 有 的 环境 光 项 都 会 以 同样 的 宫 度 将 物 
体 稍微 照 亮 一 些 ， 以 至 阴影 中 的 物体 并 不 是 纯 黑 色 的 一 一 毕竟 我 们 进行 
的 并 非 真 正 的 物理 计算 。 间 接 光 会 在 场景 中 散射 旦 反射 多 次 ， 并 从 各 个 
方向 均等 地 照射 在 物体 之 上 。 图 21.1 所 示 的 就 是 这 种 情况 ， 如 果 仅 采用 
环境 光 项 来 绘制 模型 ， 那 么 物体 将 会 被 同一 种 单一 颜色 所 泻 染 。 





"| Ambient Occlusion FPS: 2444 Frame Time: 0.409165 (ms) Eo 









































图 21.1 这 是 一 个 仅 用 环境 光 项 泻 染 的 网 格 ， 整 体 上 只 表现 出 了 唯一 一 种 单 色 








从 图 21.1 可 以 很 明显 地 看 出 ， 我 们 对 环境 光 项 还 有 一 些 改 展 的 余 
地 。 在 本 章 中 ， 我 们 将 就 流行 于 改善 环境 光 项 的 环境 光 遮 蔽 撤 术 展开 讨 


论 。 





学 习 目 标 : 








1. 理解 环境 光 遮 珊 技 术 背 后 的 基本 原理 ， 并 知道 如 何 通过 投射 光 
线 来 实现 环境 光 亡 珊 。 








2 学 习 如 何在 屏幕 空间 中 实现 名 为 屏幕 空间 环境 光 遮 项 "这 种 近 
似 于 实时 环境 光 遮 蔽 的 技术 。 


21.1 通过 投射 光线 实现 环境 光 有 遮蔽 


环境 光 庶 蔽 (ambient occlusion， 也 有 译作 环境 光 吸 收 等 ) 技术 的 
主体 思路 如 图 21.2 所 示 ， 表 面 上 一 点 P 所 收 到 的 间接 光 总 量 ， 与 照射 到 
以 五 为 中 心 的 半球 的 入 射 光 量 成 正比 。 


/N\A 


(a) (b) 





图 21.2 〈a) 中 ， 一 个 完全 不 受 任何 物体 遮挡 的 点 媚 ， 以 及 所 有 入 射 光 均 能 照射 到 的 以 瑟 为 中 


























心 的 半球 。 我 们 以 此 半球 来 度量 点 P 收 到 的 光量 “'b) 中 ， 周 围 环境 中 的 部 分 几何 体 遮挡 了 点 
如 ， 并 阻止 光线 照射 到 以 五 为 中 心 的 羊 球 





一 种 估算 点 P 受 遮蔽 程度 的 方法 是 采用 投射 光线 法 (ray casting， 从 
几何 角度 来 看 也 有 译作 射线 投射 法 ) 。 有 具体 做 法 是 ， 我 们 随机 投射 出 一 
些 光 线 ， 使 它们 罕 过 以 点 P 为 中心 的 半球 ， 并 检测 这 些 光 线 与 网 格 〈( 也 
就 是 周围 阻挡 光线 照射 到 点 P 的 “障碍 物 ”) 相交 的 情况 〈 见 图 21.3) 。 如 
果 投 射 了 条 光线 ， 而 其 中 的 ph 区 与 网 格 相 区 ， 则 点 P 所 对 应 的 遮 政 率 
为 : 





六 
一 E|0.1 
0, 


occlusion = 


a 




















图 21.3 ”通过 投射 光线 来 估算 环境 光 遮 蔽 





事实 上 ， 只 有 妆 光 线 与 网 格 的 交点 9 到 点 P 之 间 的 距离 小 于 茶 个 阐 值 
d 时 ， 才 会 将 此 光线 记 作 受到 遮挡 。 这 是 因为 各 交点 9 与 点 PD 之 间 的 距离 
过 远 就 说 明 在 这 个 方向 上 照射 到 点 P 的 光 不 会 受到 周围 物体 的 遮挡 。 














遮 责 因子 〈occlusion factor) 用 于 计量 目标 点 被 遮蔽 的 光线 比例 
《 即 有 多 少 光 线 无 法 接收 到 ) 。 计 算 此 值 的 目的 ， 其 实 是 为 了 用 与 其 意 
义 刚好 相反 的 数据 来 进行 后 续 的 计算 工作 。 即 ， 我 们 希望 了 解 到 底 有 多 
少 光 线 可 以 抵达 目标 点 这 被 称 为 可 及 率 (accessibility， 也 有 译作 可 
访问 性 等 ， 或 称 为 环境 光 可 及 率 ，ambient-access) ， 此 值 可 根据 遮 责 率 
求 出 : 





accessiblity = 1 ~— occlusion € [0,1| 


在 以 下 代码 中 ， 我 们 针对 每 个 网 格 三 角形 都 投射 了 光线 ， 并 为 三 角 
形 共 用 顶点 处 的 让 项 率 求 取 了 平均 值 。 光 线 的 起 点 就 位 于 三 角形 的 重心 
Ccentroid) ， 我 们 以 此 生成 随机 方 癌 的 光线 通过 包围 该 三 角形 的 半 
于 





void AmbientOocclusionApp::BuildVertexAmbientOocclusion( 
std: :Vector<Vertex: :AmbientOcclusion>& vertices, 
const std::vector<UINT>& indices) 


UINT vcount = vertices.size(); 
UINT tcount = indices.size()/3; 


std: :Vector<XMFLOAT3> positions(vcount); 
for(UINT i = 6;j i «< vcount; ++i) 
positions[i] = vertices[i].Pos; 


Octree octree,; 
octree.Build(positions, indices); 





// 对 于 每 个 顶点 ， 要 统计 它们 被 三 角形 所 共用 的 情况 


std: :vector<int> vertexSharedCount(vcount); 





// 针对 每 个 网 格 三 角形 投射 光线 ， 并 根据 共享 顶点 的 三 角形 数量 ， 对 该 项 点 处 的 遮蔽 数据 
求 取 平均 值 





for(UINT i = 6;j i «< tcount; ++i) 
{ 

UINT i@ = indices[i*3+0]; 

UINT i1 = indices[i*3+1]; 

UINT i2 = indices[i*3+2]; 


XMVECTOR ve 
XMVECTOR v1 
XMVECTOR v2 


XMLoadFloat3(&vertices[i6].Pos); 
XMLoadFloat3(&vertices[i1].Pos); 
XMLoadFloat3(&vertices[i2].Pos); 


XMVECTOR edge6 = v1 - ve; 
XMVECTOR edge1 = v2 - ve; 


XMVECTOR normal = XMVector3Normalize( 
XMVector3Cross(edge6，edge1) ) ; 


XMVECTOR centroid = (ve + v1 + vV2)/3.6f; 


// 为 避免 自 相交 (self intersection) 的 情况 ， 对 重心 稍 作 偏 移 


centroid += 860.6601f*normal; 





const int NumSampleRays = 32; 

float numUnoccluded = 0; 

for(int j = 6j j < NumSampleRays; ++j) 
{ 


XMVECTOR randomDir = MathHelper::RandHemisphereUnitVec3(normal); 


// 测试 随机 投射 出 的 光线 是 否 与 场景 中 的 网 格 相交 








// 待 办 事项 : 从 技术 上 讲 ， 我 们 不 应 当 统计 距 被 遮挡 三 角形 过 远 的 交点 ， 但 是 这 样 
做 对 于 演示 程序 来 
// 讲 影响 不 大 
if( loctree.RayOctreeIntersect(centroid, randomDir) ) 
{ 
numUnoccluded++; 
} 
} 




















float ambientAccess = numUnoccluded / NumSampleRays; 


// 为 此 三 角形 上 的 顶点 累加 环境 光 可 及 率 ， 并 增加 顶点 被 三 角形 所 引用 的 次 数 
vertices[i6].AmbientAccess += ambientAccess; 
vertices[i1].AmbientAccess += ambientAccess; 
vertices[i2].AmbientAccess += ambientAccess; 





vertexSharedCount[i8]++; 
vertexSharedCount[i1]++; 
vertexSharedCount[i2]++; 








} 
// 最 后 ， 通 过 每 个 顶点 累加 的 环境 光 可 及 率 除 以 累加 的 顶点 共享 次 数 来 求 取 每 个 顶点 处 遮 
向 数据 的 平均 值 ， 








// 并 将 结果 存 入 顶点 属性 


for(UINT i = 6j i «< vcount; ++i) 


{ 


vertices[i].AmbientAccess /= vertexSharedCount[i]; 





注 二 Note 和 


例 程 使 用 了 一 棵 八 又 树 〈octree) 来 为 光线 〈 射 线 ) 与 三 角形 的 相 
交 检 测 提速 。 对 于 一 个 具有 上 千 个 三 角形 的 网 格 来 讲 ， 要 为 每 个 随机 交 
线 与 每 个 网 格 三 角形 进行 检测 ， 其 过 程 是 极其 缓慢 的 。 八 又 树 会 将 三 角 
形 按 空 间 进行 划分 ， 因 此 我 们 就 可 以 快速 地 找到 那些 与 光线 相 区 概率 更 
大 的 三 角形 ， 从 而 大 幅 减 少 光 线 与 三 角形 相交 检测 的 次 数 。 八 又 树 是 一 








种 经 典 的 空间 数据 结构 ， 在 本 章 练习 1 的 指引 下 ， 我 们 将 继续 对 其 进行 
探索 。 


图 21.4 所 示 的 是 仅 以 上 述 算 法 《场景 中 是 没有 光源 的 ， 即 仅 用 间接 
光 ) 生成 的 环境 光 让 珊 数 据 所 泻 染 出 的 模型 效果 。 生 成 环境 光 和 遮蔽 的 数 
据 作为 程序 初始 化 期 间 的 一 个 预计 算 步 又， 得 到 的 结果 存 为 顶点 属性 。 
正如 我 们 所 看 到 的 ， 这 个 效果 与 图 21.1 所 示 的 画面 相 比 有 了 极 大 的 改观 
一 一 此 时 ， 这 个 模型 才 宇 有 立体 感 。 











环境 光 遮 蔽 的 预计 算 工 作对 于 静态 模型 来 讲 是 很 易 实现 的 ， 甚 至 有 
一 些 工 具 还 能 直接 生成 环境 光 遮 责 图 (ambient occlusion map) ， 即 存 
有 环境 光 遍 蔽 数据 的 纹理 。 然 而 ， 对 于 动态 模型 来 讲 ， 这 些 静 态 方法 就 
完全 不 适用 了 。 如 果 加 载 并 运行 了 “Ambient Occlusion”《〈 环 境 光 遮 珊 ) 
演示 程序 由 ， 我 们 将 发 现 ， 仅 为 一 个 模型 预计 算 环 境 光 遮蔽 数据 就 要 花 
费 耕 干 秒 。 因 此 ， 以 光线 投射 法 在 运行 时 实现 动态 环境 光 氮 蔽 技术 是 不 
可 行 的 。 在 下 一 节 中 ， 我 们 将 考察 一 种 通过 屏幕 空间 信息 来 实时 计算 环 
境 光 遮 藤 的 流行 技术 。 








图 21.4 仅 采用 环境 光 遮 巩 技术 渲染 的 网 格 一 一 其 中 并 不 存在 任何 场景 光源 。 可 以 注意 到 模型 

缝隙 间 的 颜色 更 深 ， 这 是 由 于 从 这 些 地 方 投射 出 的 光线 有 更 大 概率 与 附近 的 几何 体 相交 ， 并 增 

大 遮蔽 率 。 此 外 ， 天 灵 盖 部 分 则 呈现 白色 《未 受 遮蔽 ) ， 这 是 因为 在 我 们 从 此 区 域 上 的 点 向 半 
球 投射 光线 时 ， 它 们 不 会 与 骼 通 头 上 任何 其 他 的 几何 体 相 交 


21.2 屏 适 空间 环境 光 刻 菩 





屏幕 空间 环境 光 近 英 (Screen Space Ambient Occlusion，SSAO) 技 
术 所 采用 的 策略 是 ， 在 泻 染 每 一 帧 画面 的 过 程 中 ， 将 场景 观察 空间 中 的 
法 线 绘制 到 一 个 全 屏 泻 染 目标 〈full screen render target) ， 并 把 场景 深 
度 绘 制 到 一 个 普通 Www 接 下 来 ， 仅 用 上 述 观 察 空 间 法 
线 洽 染 上 日 标 和 深度 /模板 缓冲 区 作为 输入 ， 在 每 个 像 系 处 估算 出 相应 的 
环境 光 遮 蔽 数据 。 只 要 得 到 了 存 有 每 个 像素 处 环境 光 遮 蔽 数据 的 纹理 ， 
我 们 就 以 这 一 纹理 中 的 SSAO 信 息 来 为 每 个 像素 调整 环境 光 项 ， 再 像 往 
第 那样 将 处 理 后 的 场景 绘制 到 后 台 绥 冲 区 中 。 














21.2.1 法 线 与 深度 值 的 泻 染 过 程 





首先 ， 我 们 要 把 场景 中 各 物体 的 观察 空间 法 同 量 泻 桨 到 与 屏幕 大 小 
相同 、 格 式 为 DXGI_FORMAT_R16G16B16A16_FLOAT 的 纹理 图 之 内 ， 同 
时 还 要 绑 定 置 有 场景 深度 的 普通 深度 /模板 缓冲 区 。 在 这 个 演 染 过 程 
中 ， 所 用 的 顶点 着 色 器 与 像素 着 色 器 的 代码 如 下 。 























// 包含 公用 的 HLSL 代 码 


#include "Common.hlsl" 


struct VertexIn 


float3 PosL : POSITION; 

float3 NormalL : NORMAL; 

float2 TexC : TEXCOORD; 

float3 TangentU : TANGENT; 
}; 


struct VertexOut 

{ 
float4 PosH : SV_POSITION; 
float3 NormalW : NORMAL; 
float3 TangentW : TANGENT; 
float2 TexC : TEXCOORD; 


}; 


VertexOut VS(VertexIn vin) 


{ 
VertexOut vout = (VertexOut)0.ef; 





// 获取 材质 数据 
MaterialData matData = gMaterialData[gMaterialIndex]; 
































// 这 里 执行 的 是 等 比 缩放 ， 否 则 应 使 用 世界 和 矩阵 的 逆转 置 矩 阵 进 行 计算 
vout .NormalN = mul(vin.NormalL, (float3x3)gWorld); 
vout.TangentW = mul(vin.TangentU, (float3x3)gWorld); 




















// 将 顶点 变换 到 齐 次 裁剪 空间 
float4 posW = mul(float4(vin.PosL, 1.6f), gWorld); 
vout.PosH = mul(posW, gViewpPro]j); 














// 为 三 角形 插值 而 输出 项 点 属性 
float4 texC = mul(float4(vin.TexC, 868.6f, 1.6f), gTexTransform); 
vout.TexC = mul(texC, matData.MatTransform) .xy; 




















return vout; 


} 


float4 PS(VertexOut pin) : SV_Target 
{ 
// 获取 材质 数据 
MaterialData matData = gMaterialData[gMaterialIndex]; 
float4 diffuseAlbedo = matData.DiffuseAlbedo 
uint diffuseMapIndex = matData.DiffuseMapIndex; 
uint normalMapIndex = matData.NormalMapIndex; 

















// 动态 查找 数组 中 的 纹 形 
diffuseAlbedo *= gTextureMaps[diffuseMapIndex]. 
Sample(gsamAnisotropicWrap, pin.TexC); 








| 


#ifdef ALPHA _ TEST 
// 丢弃 纹理 中 alpha < 8.1 的 像素 。 我 们 应 在 着 色 器 中 及 早 地 进行 这 项 测试 ， 尽 量 满足 条 
件 的 像素 提前 
// 退出 着 色 器 的 处 理 ， 跳 过 后 续 没 必要 执行 的 着 色 器 代码 ， 从 而 优化 性 能 
clip(diffuseAlbedo.a - 6.1f); 
#endif 








































































































// 对 法 线 插 值 可 能 导致 其 非 规 范 化 ， 因 此 要 重新 对 它 进行 规范 化 处 理 


pin.NormalW = normalize(pin.NormalW); 




















// 注意 : 为 SSA0 而 使 用 插值 顶点 法 线 











// 返回 法 线 的 观察 空间 坐标 
float3 normalV = mul(pin.NormalW, (float3x3)gView); 
return float4(normalV, 08.6f); 





如 上 述 代码 所 示 ， 像 素 着 色 占 输出 了 观察 空间 中 的 法 回 量 。 为 外 ， 
这 一 次 采用 的 是 浮 点 泻 染 目 标 ， 因 此 向 其 中 写 入 任何 浮 点 数据 都 是 合理 
的 。 





21.2.2 ”环境 光 遮 责 的 泻 染 过 程 


在 布置 好 观察 空间 法 线 以 及 场景 深度 之 后 ， 我 们 就 禁用 深度 缓冲 区 
《在 生成 环境 光 遮 珊 纹 理 时 不 需要 对 该 缓冲 区 做 任何 改动 ) ， 并 在 每 个 
像素 处 调用 SSAO 像 素 着 色 嚣 来 绘制 一 个 全 屏 的 四 边 形 (full screen 
quad) 。 这 样 一 来 ， 该 像素 着 色 器 将 运用 法 线 纹理 以 及 深度 缓冲 区 为 每 
个 像素 生成 一 个 对 应 的 环境 区 可 及 率 数据 ， 我 们 称 在 这 个 泻 染 过 程 中 所 


后 台 绥 冲 区 的 分 辨 率 ) 演 染 了 法 线 图 与 深度 图 ， 但 是 出 于 对 性 能 的 考 

虑 ， 仅 按 深度 缓冲 区 高 度 以 及 宽度 的 一 半 来 演 染 SSAO 图 。 以 这 种 方式 
来 演 染 SSAO 图 并 不 会 过 于 影响 泻 染 质量 ， 因 为 环境 光 和 遮蔽 本 刁 就 是 一 
种 低频 效果 (low frequency effect，LFE) [4。 注 意 ， 后 续 几 小 节 都 是 围 
绕 图 21.5 展 开 的 。 





输入 到 像素 着 色 器 中 的 插值 -… 
“至 近 平 面 ” 


向 量 





(to-near-plane) 















图 21.5 SSAO 技 术 中 要 用 到 的 各 种 关键 点 。 点 就 是 我 们 当前 正在 处 理 的 像素 ， 根 据 从 观察 点 
至 该 像素 在 近 平面 内 对 应 点 的 向 量 V 以 及 深度 缓冲 区 中 存储 的 对 应 深度 值 来 重新 构建 点 王 。 点 Q 




















是 以 点 P 为 中 心 的 半球 内 的 随机 一 点 ， 点 T 则 是 从 观察 点 到 4 这 一 路 径 上 的 最 近 可 视点 。 如 果 


IP: 一 图 够 小 ， 且 7 一 五 与 m 之 间 的 夹 角 小 于 90"， 那 么 点 r 将 计 入 点 卫 的 遮 项 值 。 在 这 个 例 


程 中 ， 我 们 采 上 月 





日 了 14 个 随机 样 点 ， 昨 





中 根据 平均 值 法 求 得 的 遮蔽 率 来 估算 屏幕 空间 中 的 环境 光 庶 





21.2.2.1 重新 构建 待 处 理 点 在 观察 空间 中 的 位 置 


当 我 们 为 绘制 全 屏 四 边 形 而 对 SSAO 图 中 的 每 个 像素 依次 调用 SSAO 
像素 着色 器 时 ， 可 利用 投影 矩阵 的 逆 窍 阵 ， 将 位 于 NDC 空 间 中 四 边 形 的 
角 点 〈corner point) 变换 到 近乎 面 投影 窗 口上 的 点 。 





static const float2 gTexCoords[6] = 
{ 
float2(6 . 
float2(6 . 


float2(1 


}; 


ef, 
ef, 


.Of， 
float2(6 . 
float2(1. 
float2(1. 


ef, 
ef, 
ef, 


1.6f), 
6.6f)， 
8. 
1 
6 
1 


ef ), 


.6f), 
.6f), 
.6f) 






































// 利用 构成 四 边 形 的 6 个 顶点 进行 绘制 调用 
VertexOut VS(uint vid : SV VertexID) 








VertexOut vout; 


vout.TexC = gTexCoords[vid]; 





// 将 展示 在 屏幕 上 全 屏 四 边 形 变换 至 NDC 空 间 
vout .PosH = float4(2.6f*vout.TexC.x - 1.6f，1.6f - 2.6f*vout.TexC.y, 
6.69f，1.6f); 

















// 将 四 边 形 的 各 角 点 变换 到 观察 空间 的 近 平 面 
float4 ph = mul(vout.PosH, gInvProj); 
vout.PosV = ph.xyz / ph.w; 





return vout; 





这 些 “ 至 近 平 面 ”(to-near-plane) 癌 量 都 是 经 四 边 形 内 插 而 得 到 
的 ， 它 给 出 的 图 21.5 中 给 出 的 v 就 是 每 个 像素 从 观察 点 到 近 平 面 的 癌 
量 。 现 在 ， 我 们 将 为 每 个 像素 采集 深度 值 以 获取 点 P 至 观察 点 路 径 中 最 

近 可 视点 :坐标 产 的 NDC 坐 标 。 这 样 做 的 最 终 目 的 ， 是 根据 采集 的 NDC 

人 
中 的 位 置 了 = (pz; Py, P:)。 以 下 是 重建 的 思路 : 由 于 与 向 量 v 同 起 点 共 方 
向 的 光线 通过 点 忆 ， 因 此 也 就 存在 一 个 值 满 足 忆 = tv。 此 时 ， 我 们 得 到 


和 
p: = 和-， 那 么 一 严 /u。 因 此 ?一 二 "。 像 素 着 色 器 中 重建 观察 空间 位 置 
的 代码 如 下 。 


























float NdcDepthToViewDepth(float z_ndc) 








{ 

// 我 们 可 以 执行 将 z 坐 标 从 NDC 空 间 变 换 到 观察 空间 的 逆 运 算 。 由 于 我 们 有 z_ndc = A + 
B/viewzZ, 

// 其 中 gpProj[2,2]=A 且 gProj[3,2]=B， 因 此 .…. 

float viewZz = gProj[3][2] / (z_ndc - gProj[2][2]); 

return viewZ; 


} 























float4 PS(VertexOut pin) : SV_Target 


{ 
// 从 深度 图 中 获取 该 像素 在 NDC 空 间 内 的 z 坐 标 
float pz = gDepthMap.SampleLevel(gsamDepthMap, pin.TexC, 60.6f).r; 
// 将 深度 值 变 换 到 观察 空间 
pz = NdcDepthToViewDepth(pz); 











// 用 深度 值 pz 重新 构建 此 点 在 观察 空间 中 的 位 置 
float3 p = (pz/pin.PosV.z)*pin.PosyV; 











21.2.2.2 ”生成 随机 样 点 


这 个 步 又 模拟 的 是 向 半球 随机 投射 光线 的 过 程 。 我 们 以 Pp 为 中 心 ， 
在 指定 的 遮蔽 半径 (occlusion radiu〉 内 随机 地 从 点 P 的 前 侧 部 分 采集 入 
个 点 ， 并 将 其 中 的 任意 一 点 记 作 qq。 遮 蔽 半径 是 一 项 影响 艺术 效果 的 参 
数 ， 它 控制 着 我 们 采集 的 随机 样 点 相对 于 点 P 的 距离 。 而 选择 仅 采 集 点 P 
前 侧 部 分 的 点 ， 束 相当 于 在 以 光线 投 映 的 方式 执行 环境 光 氮 滴 时， 只 需 
在 半球 内 进行 投射 而 不 必 在 完整 的 球体 内 投射 而 已 。 

















接 下 来 的 问题 是 如 何 来 生成 随机 样 点 。 一 种 解决 方案 是 ， 我 们 可 以 
生成 随机 向 量 并 将 它们 存 于 一 个 纹理 图 中 ， 再 在 纹理 图 的 N 个 不 同位 置 
获取 NN 个 随机 同 量 。 然 而 ， 由 于 整个 计算 过 程 都 是 随机 的 ， 所 以 我 们 并 
不 能 保证 采集 的 问 量 必定 是 均匀 分 布 ， 也 就 是 说 ， 会 有 全 部 问 量 趋 于 同 
问 的 风险 ， 如 此 一 来 ， 遮 蔽 率 的 估算 结 末 必然 有 失 偶 硕 。 为 了 解决 这 个 
问题 ， 我 们 将 采取 下 列 技巧 。 在 我 们 采用 的 实现 方法 之 中 共 使 用 了 
N = 14 个 采样 点 ， 并 以 下 列 C++ 代 码 生 成 14 个 均匀 分 布 的 癌 量 。 


void Ssao::BuildoffsetVectors() 

















{ 





选 








// 采用 14 个 均匀 分 布 的 向 量 实现 环境 光 氮 蔽 技 术 。 我 们 选择 的 是 立方 体 的 8 个 角 点 以 及 6 
个 面 上 的 中 心 
// 点 作为 回 量 点 。 并 将 这 些 点 以 立方 体 空间 位 置 上 相对 的 顺序 交 敬 排列。 这 样 一 来 ， 即 使 





























| 的 采样 点 小 


// 于 14 个 ， 我 们 仍然 可 以 得 到 比较 分 散 的 向 量 











// 8 个 立方 体 角 点 


moOffsets[6] = 


moffsets[1] 


moffsets[2] 
moffsets[3] 


moffsets[4] 
moffsets[5] 


moffsets[6] 
moffsets[7] 


XMFLOAT4(+1. 
.@f, 


XMFLOAT4( -1 


XMFLOAT4(-1. 
XMFLOAT4(+1. 


XMFLOAT4(+1. 
XMFLOAT4(-1. 


XMFLOAT4(-1. 
XMFLOAT4(+1. 


// 6 个 立方 体面 的 中 心 点 


moOffsets[8] = XMFLOAT4(-1. 
moOffsets[9] = XMFLOAT4(+1， 


moOffsets[16] 
moOffsets[11] 


moffsets[12] 
moOffsets[13] 





XMFLOAT4(6. 
XMFLOAT4(6 . 


XMFLOAT4(6 . 
XMFLOAT4(6 . 


6f， 


6f， 
6f， 


for(int i = 6j i < 14; ++i) 











册 | 





.6f， 
.6f， 


.Of) ; 
.Of) ; 


.6f， 
.6f， 


.Of) ; 
.Of) ; 


.Of) ; 
.Of) ; 


.Of) ; 
.Of) ; 
.Of) ; 


.Of) ; 


-1.0f, 0.6f, 0.6f); 
+1.0f, 0.06f, 0.6f); 


0.6f, -1.06f, 0.6f); 
0.6f, +1.06f, 0.6f); 


{ 
// 创建 长 度 范围 在 [6.25，1.6] 内 的 随机 长 度 向 量 
float s = MathHelper::RandF(60.25f, 1.6f); 


XMVECTOR v = s * XMVector4Normalize(XMLoadFloat4(&mOffsets[i])); 


XMStoreFloat4(&mOffsets[i], Vv); 


} 


注 意 Note i 








因为 使 用 的 是 4D 齐 次 同 量 ， 所 以 在 HLSL 文 件 中 设置 侦 移 癌 量 数组 
Coffset vector array， 即 上 文 C++ 部 分 中 的 moffsets 与 下 文 HLSL 文 件 中 
的 gOffsetVectors) 时 ， 不必 担心 任何 的 对 齐 问题 。 


到 目前 为 止 ， 我 们 在 像素 着 色 器 中 采集 了 一 次 随机 向 量 的 纹理 图 ， 
并 用 和 它 来 对 14 个 均匀 分 布 的 癌 量 进行 反射 〈reflect) 。 其 最 终结 果 便 是 
获得 了 14 个 均匀 分 布 的 随机 同 量 (equally distributed random vector) 。 








21.2.2.3 生成 潜在 的 遮蔽 点 


我 们 现在 获得 了 围绕 点 P 的 各 随机 采样 点 9。 由 于 仍 不 知道 它们 所 处 
的 位 置 到 底 是 空 无 一 物 还 是 实心 物体 ， 因 此 还 不 足以 检测 出 在 这 个 方向 
上 点 P 是 否 被 遮 住 了 。 为 了 找到 那些 有 可 能 遮挡 住 点 P 的 点 ， 就 需要 用 到 
深度 缓冲 区 中 的 深度 信息 。 所 以 我 们 要 做 的 就 是 以 摄像 机 的 视角 为 每 个 
点 4 生成 投影 纹理 坐标 ， 根 据 这 些 坐 标 来 对 深度 缓冲 区 采样 以 获取 NDC 

空间 中 对 应 的 深度 值 ， 接 着 将 它们 变换 至 观察 空间 来 求 得 从 观察 点 至 点 
Pp 方向 上 距离 观察 点 最 近 的 深度 值 "-:。 知 道 了 :坐标 ": 后 ， 我 们 就 能 依照 
类 似 于 21.2.2.1 节 中 所 述 的 方法 ， 重 新 构建 出 全 屏 3D 观 察 空 间 中 点 r 的 准 
确 位 置 。 由 于 从 观察 点 至 点 4 方向 的 向 量 会 经 过 失 r， 因 此 存在 (使 得 





















































r 二 tg。 特别 是 7: = 好:， 那 么 := ~:/4:。 所 以 ， ”9 由 此 可 知 ， 根 据 
每 个 随机 采样 点 9 所 生成 的 点 r 即 为 潜在 的 遮 珊 点 。 


21.2.2.4 执行 遮 责 检 测 


既然 我 们 现在 得 到 了 潜在 的 诞 丽 点 r， 也 就 能 够 执行 遮蔽 检测 来 佑 
算 点 Pp 是 否 被 它们 遮挡 住 。 该 测试 依赖 于 两 种 量 值 。 





1. 观察 空间 中 点 P 与 点 + 的 深度 距离 为 ?: "|。 随 着 此 距离 的 增 
长 ， 遮 珊 值 将 按 比 例 线性 缩小 。 这 是 因为 随 独 遮蔽 点 与 目标 点 距离 越 
远 ， 其 遮 丽 效果 也 就 越 弱 。 如 果 该 距离 超过 某 个 指定 的 最 大 距离 ， 那 么 
扩 7 将 完全 不 会 己 挡 点 P。 而 且 ， 如 果 此 距离 过 小 ， 我 们 就 认为 点 P 与 扩 4 
位 于 同一 平面 上 《 共 面 ) ， 因 此 点 4 在 这 种 情况 下 也 不 会 让 挡 点 P。 








0 
IaxX | 79 | 一 | .0U 
2. 问 量 n 与 7 一 了 之 间 夹 角 的 测定 方法 为 ( (全 ) 
这 是 为 防止 自 相 交 (self-intersection) 情况 的 发 生 ( 见 图 21.6) 。 

















图 21.6 ”如 果 点 7 与 点 P 位 于 同一 平面 内 ， 便 可 满足 第 一 个 条 件 ， 即 距 亢 P: 一 | 足够 小 以 至 于 
点 T 遮 椭 了 点 避 。 然 而 ， 从 图 中 可 以 看 出 ， 两 者 在 同一 平面 内 的 时 候 ， 点 7 并 没有 遮挡 点 P。 通 
(FE 
max | 7 .0 
过 计算 Ir 一 如 | 调整 遮 责 值 便 可 以 防止 对 此 情况 的 误 判 















































21.2.2.5 ”完成 计算 过 程 


在 将 每 个 样 点 的 遮 珊 数据 相 加 之 后 ， 还 要 通过 除 以 采样 的 次 数 来 计 
算 遮 珊 率 。 接 着 ， 我 们 会 计算 环境 区 可 及 率 ， 并 对 它 进 行 才 运算 以 提高 
对 比 度 《〈contrast) 。 当 然 ， 我 们 也 能 够 按 需 求 适 当 增 加 一 些 数值 来 提高 
光照 强度 ， 以 此 为 环境 光 图 (ambient map) 增加 亮度 。 除 此 之 外 ， 我 们 
还 可 以 党 试 不 同 的 对 比值 与 亮度 值 。 








occlusionSum /= gSampleCount; 


float access = 1.6f - occlusionSum; 





// 提高 SSA0 图 的 对 比 度 ， 使 SSAO0 的 效果 更 为 显著 


return saturate(pow(access, 4.06f)); 








21.2.2.6 ”具体 实现 


在 前 一 节 中 ， 我 们 罗列 了 生成 SSAO 图 的 关键 要 点 。 以 下 是 HLSL 程 
序 的 具体 实现 。 














cbuffer cbssao : register(b6) 
{ 

float4x4 gProj; 

float4x4 gInvProj; 

float4x4 gProjTex; 

float4 gOffsetVectors[14]; 





// 用 于 SsaoBlur.hlsl 程 序 
float4 gBlurWeights[3]; 





float2 gInvRenderTargetSize; 


// 指定 的 观察 空间 中 的 各 坐标 
float gOcclusionRadius; 
float gOcclusionFadeStart; 
float gOcclusionFadeEnd; 





float gSurfaceEpsilon; 
}; 


cbuffer cbRootConstants : register(b1) 
{ 


bool gHorizontalBlur; 


}; 


// 非 数值 数据 是 不 能 添加 到 常量 缓冲 区 中 的 
Texture2D gNormalMap : register(t6); 
Texture2D gDepthMap : register(t1); 
Texture2D gRandomVecMap : register(t2); 




















SamplerState gsamPointClamp : register(s6); 
SamplerState gsamLinearClamp : register(s1); 
SamplerState gsamDepthMap : register(s2); 

SamplerState gsamLinearWrap : register(s3); 


static const int gSampleCount = 14; 


static const float2 gTexCoords[6] = 
{ 


float2(6.6f，1.6f)， 
float2(0.06f, 0.6f), 
float2(1.6f，6.6f)， 
float2(6.6f，1.6f)， 
float2(1.6f，6.6f)， 
float2(1.9f，1.6f) 


}; 


struct VertexOut 


{ 
float4 PosH : SV_POSITION; 


float3 PosV : POSITION; 
float2 TexC : TEXCOORD®; 


}; 


VertexOut VS(uint vid : SV VertexID) 
{ 


VertexOut vout; 


vout.TexC = gTexCoords[vid]; 


// 将 呈现 在 屏幕 上 的 全 屏 四 边 形变 换 NDC 空 间 
vout.PosH = float4(2.6f*vout.TexC.x - 1.6f, 1.6f - 2.6f*vout.TexC.y, 
6.6f, 1.6f); 














// 将 四 边 形 的 诸 角 点 变换 至 观察 空间 中 的 近 平面 上 





float4 ph 
vout.PosV 


mul(vout.PosH, gInvProj); 
ph.xyz / ph.w; 


return vout; 


} 


// 将 确定 目标 样 点 p 被 点 9 遮挡 程 度 的 任务 封装 成 这 个 以 distZ 作 为 参数 的 函数 
float OcclusionFunction(float distZ) 
{ 





























// 

// 如 果 depth(q) 位 于 depth(p)“ 之 后 ”( 超 出 半球 范围 ) ， 则 点 q 无 法 遮挡 点 p 

// 而 且 ， 若 depth(q) 与 depth(p) 距 离 过 近 ， 亦 认为 点 q 不 能 遮 住 点 p， 这 是 因为 只 有 点 q 
位 于 点 p 之 

// 前 并 根据 用 户 定 义 的 Epsilon 值 才能 确定 点 q 对 点 p 的 遮蔽 程度 

// 

// 我 们 通过 下 列 函 数 来 确定 遮蔽 值 

// 

// 




































































// 2 \ 


a ni 
// 0 


float occlusion = 60.60f; 
if(distZ > gSurfaceEpsilon) 


float fadeLength = gOcclusionFadeEnd - gOcclusionFadeStart; 








// 随 着 distz 由 gOcclusionFadeStart 趋 向 于 gOcclusionFadeEnd， 遮 蔽 值 由 1 线性 
减 小 至 6 
occlusion = saturate( (gOcclusionFadeEnd-distZ)/fadeLength ) 
} 




















return occlusion; 


} 


float NdcDepthToViewDepth(float z_ndc) 
{ 














// z_ndc = A + B/viewz， 其 中 gProj[2,2]=AHgProj[3,2]=B 
float viewZz = gProj[3][2] / (z_ndc - gProj[2][2]); 
return viewZ; 


} 


float4 PS(VertexOut pin) : SV_Target 
{ 
// p -- 我 们 要 计算 的 环境 光 遮 蔽 目标 点 
// n -- 点 p 处 的 法 向 量 
// q -- 随机 偏离 于 点 p 的 一 点 
// r -- 有 可 能 遮挡 点 p 的 一 点 












































// 获得 像 系 p 于 观 3 察 空 间 中 的 法 线 与 z 坐 标 

float3 n = gNormalMap.SampleLevel(gsamPointClamp，pin.TexC，6.6f).xyz; 
float pz = gDepthMap.SampleLevel(gsamDepthMap, pin.TexC, 6.6f).r; 

pz = NdcDepthToViewDepth(pz); 








// 重新 构建 精确 的 全 屏 观 察 空间 位 置 (x,y,z) 
// 求 出 满足 p = txpin.PosV 的 t 

// p.z = t*pin.PosV.z 

// t = p.z / pin.PosV.z 











float3 p = (pz/pin.PosV.z)*pin.PosyV; 

















// 提取 随机 向 量 并 将 它 从 区 间 [8,1] 映 射 至 [-1，+1] 
float3 randVec = 2.6f*gRandomVecMap.SampleLevel( 
gsamLinearWrap, 4.6f*pin.TexC, 86.6f).rgb - 1.6f; 





float occlusionSum = 0.6f; 

















// 在 以 p 为 中 心 的 半球 内 ， 根 据 法 线 n 对 p 周 围 的 点 进行 采样 


for(int i = 6; i «< gSampleCount; ++i) 




















{ 
// 偏 移 向 量 都 是 固定 且 均 匀 分 布 的 (所 以 我 们 采用 的 偏 移 同 量 不 会 在 同一 方向 上 扎堆 》 
。 如 果 将 它们 关 
// 于 一 个 随机 向 量 进行 反射 ， 则 得 到 的 必 为 一 组 均匀 分 布 的 随机 偏 移 向 量 
float3 offset = reflect(gOffsetVectors[i].xyz, randVec); 









































// 如 果 此 偏 移 向量 位 于 (p，n) 所 定义 的 平面 之 后 ， 就 翻转 (flip) 该 偏 移 向 量 
float flip = sign( dot(offset, n) ); 








// 在 遮蔽 半径 内 采集 靠近 点 p 的 点 
float3 q = p + flip * gOcclusionRadius * offset; 

















// 投影 点 q 并 生成 相应 的 投影 纹理 坐标 
float4 projQ = mul(float4(q, 1.6f), gProjTex); 
projQ /= projQ.w; 


// 治 着 从 观察 点 至 点 q 的 光线 方向 ， 寻 找 离 观察 点 最 近 的 深度 值 。 注意， 此 值 未 必 是 














点 q 的 深度 值 ， 
// 因为 点 q 只 是 接近 于 p 的 任意 一 点 ， 而 其 位 置 可 能 是 空 无 一 物 ) 。 为 此 ， 我 们 就 需要 
查看 此 点 在 深度 
// 图 中 的 深度 值 






























































float rz = gDepthMap.SampleLevel(gsamDepthMap, projQ.xy, 6.6f).r; 
rz = NdcDepthToViewDepth(rz); 


// 重新 构建 观察 空间 中 的 位 置 坐标 r = (rx,ry,rz)。 我 们 知道 点 r 位 于 观察 点 至 点 q 的 
光线 上 ， 因 

// 此 也 就 存在 t 满 是 r 三 

// r.z = t*q.z ==> 七 














t* 
= Pz /9:2Z 


float3 r = (rz / q.z) * q; 


// 

// 测试 点 r 是 否 遮 挡 着 点 p 

// * 点 积 dot(n，normalize(r - p)) 度 量 的 是 遮蔽 点 r 距 平面 (p,n) 前 侧 的 距离 。 
越 趋 于 此 平 

// 面 的 前 侧 ， 我 们 就 给 它 设 定 越 大 的 遮蔽 权重 。 同 时 ， 这 也 能 够 防止 位 于 倾斜 面 (p,n) 
上 

// 影 (self shadow) 所 产生 出 错误 的 遮蔽 值 ， 这 是 因为 在 以 观察 点 的 视角 来 看 ， 它 
们 有 着 不 同 的 

// 深度 值 ， 但 事实 上 ， 位 于 倾斜 面 (p,n) 上 的 点 r 却 没有 遮挡 目标 点 p 

// ” * 遮蔽 权重 的 大 小 依赖 于 遮蔽 点 与 其 目标 点 之 间 的 距离 。 如 果 人 遮蔽 点 r 离 目标 点 p 过 
远 ， 则 认为 点 

//r 不 会 遮挡 遮蔽 点 p 

// 





































































































float distZ = p.z - r.z; 
float dp = max(dot(n, normalize(r - p)), 96.6ef); 
float occlusion = dp * OcclusionFunction(dist2); 


occlusionSum += occlusion; 


} 


occlusionSum /= gSampleCount; 


float access = 1.6f - occlusionSum; 


























// 增强 SSA0 图 的 对 比 度 ， 使 SSA0 图 的 效果 更 加 明显 


return saturate(pow(access, 2.06f)); 








注 意 Note a 


对 于 观察 距离 (viewing distance， 也 有 译作 取景 距离 、 视 距 等 ) 过 
远 的 场景 来 说 ， 由 于 深度 缓冲 区 精度 的 限制 可 能 产生 具有 错误 的 泻 染 效 
果 。 一 种 简单 的 解决 方案 是 随 着 距离 逐渐 变 远 来 渐渐 模糊 SSAO 的 效 
果 。 











21.2.3 ”模糊 过 程 


图 21.7 所 示 的 是 我 们 生成 的 环境 光 遮 蔽 图 的 当前 效果 。 其 中 的 噪点 
是 由 于 随机 样 点 过 少 所 导致 的 。 但 通过 采集 足够 多 的 样 点 来 屏蔽 噪点 的 
做 法 ， 在 实时 演 染 的 前 提 下 并 不 切实 际 。 对 此 ， 第 用 的 解决 方案 是 采用 
边缘 保留 模糊 〈edge preserving blur， 也 译作 保 边 模糊 。 这 里 采用 的 为 
双边 模糊 ， 即 bilateral blur) 的 过 滤 方 式 来 使 SSAO 图 的 过 渡 更 为 平滑 。 
如 果 使 用 的 过 小 方 法 为 非 边 缘 保 留 模 糊 ， 那 么 随 着 物体 边缘 的 明显 划分 
转 为 平滑 渐变 ， 会 使 场景 中 的 物体 难以 界定 。 这 种 边缘 保留 模糊 的 算法 
与 第 13 章 中 实现 的 模糊 方法 相似 ， 唯 一 的 区 别 在 于 需要 新 添加 一 个 条 件 
语句 ， 以 令 边 缘 不 受 模糊 处 理 〈 要 靠 法 线 图 与 深度 图 来 检测 边缘 ) 。 








天 SSAO Demo FPS: 335 Frame Time: 2.98507 (ms) le 




















图 21.7 ”由 于 我 们 仅 采 集 了 少量 的 随机 样本 ， 从 而 导致 SSAO 出 现 了 噪点 








// SsaoBlur.hls1l 的 作者 为 Frank Luna (C) 2615 版 权 所 有 
// 
// 为 环境 光 图 执行 双边 保 边 模糊 。 我 们 以 像素 着 色 器 代替 计算 着 色 器 来 避免 从 计算 模式 向 泻 

















染 模式 的 转换 。 
// 纹理 缓存 〈texture cache) 适当 地 弥补 了 不 有 具 共 享 内 存 的 缺陷 。 环 境 光 图 采用 的 是 16 
位 的 纹理 格式 ， 

// 由 于 它 占用 空间 较 小 ， 所 以 适 于 在 缓存 中 存储 大 量 纹 素 





















































cbuffer cbSsao : register(b6) 
{ 

float4x4 gProj; 

float4x4 gInvProj; 

float4x4 gProjTex; 

float4 gOffsetVectors[14]; 





// 用 于 SsaoBlur.hlsl 程 序 
float4 gBlurWeights[3]; 





float2 gInvRenderTargetSize; 


// 给 定 的 观察 空间 中 的 诸 坐 标 
float gOcclusionRadius; 
float gOcclusionFadeStart; 
float gOcclusionFadeEnd; 
float gSurfaceEpsilon; 


}; 


cbuffer cbRootConstants : register(b1) 
{ 


bool gHorizontalBlur; 


}; 


// 非 数值 数据 是 不 能 添加 到 常量 缓冲 区 中 的 
Texture2D gNormalMap : register(t0); 
Texture2D gDepthMap : register(t1); 
Texture2D gInputMap : register(t2); 























SamplerState gsamPointClamp : register(s6); 
SamplerState gsamLinearClamp : register(s1); 
SamplerState gsamDepthMap : register(s2); 

SamplerState gsamLinearWrap : register(s3); 


static const int gBlurRadius = 5; 


static const float2 gTexCoords[6] = 
{ 


float2(6.6f，1.6f)， 
float2(6.6f，6.6f)， 
float2(1.6f，6.6f)， 
float2(6.6f，1.6f)， 
float2(1.6f，6.6f)， 
float2(1.9f，1.6f) 


}; 


struct VertexOut 


{ 
float4 PosH : SV_POSITION; 


float2 TexC : TEXCOORD; 
}; 
VertexOut VS(uint vid : SV VertexID) 
{ 


VertexOut vout; 


vout.TexC = gTexCoords[vid]; 








// 将 显示 在 屏幕 上 的 全 屏 四 边 形 变换 至 NDC 空 间 中 
vout .PosH = float4(2.6f*vout.TexC.x - 1.6f，1.6f - 2.6f*vout.TexC.y, 
6.6f，1.6f); 


return vout; 


float NdcDepthToViewDepth(float z_ndc) 











// z_ndc = A + B/viewz， 其 中 gProj[2,2]=AHgProj[3,2]=B 
float viewZz = gProj[3][2] / (z_ndc - gProj[2][2]); 
return viewZ; 


} 








float4 PS(VertexOut pin) : SV_Target 





{ 

// 将 模糊 权重 解 包 到 浮 点 数组 中 

float blurWeights[12] = 

{ 
gBlurWeights[6].x, gBlurWeights[6].y, gBlurWeights[08].z, 
gBlurWeights[06].w, 
gBlurWeights[1].x, gBlurWeights[1|].y, gBlurWeights[1].z, 
gBlurWeights[1].w, 
gBlurWeights[2].x, gBlurWeights[2|].y, gBlurWeights[2].z, 
gBlurWeights[2].w, 








}; 
float2 texOffset ; 
if(gHorizontalBlur) 
{ 
texOffset = float2(gInvRenderTargetSize.x, 8.06f); 
} 
else 
{ 
texOffset = float2(8.6f, gInvRenderTargetSize.y); 
} 
// 总 是 将 中 心 值 计 入 总 和 之 中 
float4 color = blurWeights[gBlurRadius] * gInputMap.SampleLevel( 


gsamPpointClamp, pin.TexC, 08.0); 
float totalWeight = blurWeights[gBlurRadius|]; 


float3 centerNormal = gNormalMap.SampleLevel(gsamPpointClamp, pin.TexC, 0 
.Of) .xyz; 
float centerDepth = NdcDepthToViewDepth( 
gDepthMap.SampleLevel(gsamDepthMap, pin.TexC, 68.6f).r); 


for(float i = -gBlurRadius; i <= gBlurRadius; ++i) 














// 此 前 已 经 计 入 了 中 心 权 重 
if( i == 0 ) 
continue; 





float2 tex = pin.TexC + i*texOffset; 


float3 neighborNormal = gNormalMap.SampleLevel(gsamPpointClamp, tex, ©8. 
ef).xyz; 
float neighborDepth = NdcDepthToViewDepth( 
gDepthMap.SampleLevel(gsamDepthMap, tex, 86.6f).r); 


// 

// 如 果 中 心 值 与 邻近 数值 相差 太 大 《不论 法 线 还 是 深度 值 ) ， 就 假设 正在 采集 的 部 分 是 
不 连续 的 〈 即 处 

// 于 物体 边缘 ) ， 继 而 不 对 这 种 样本 进行 模糊 处 理 

// 


















































if( dot(neighborNormal, centerNormal) >= 6.8f && 
abs(neighborDepth - centerDepth) <= 0.2f ) 


{ 
float weight = blurWeights[i + gBlurRadius]; 











// 累加 邻近 像素 的 颜色 数据 以 进行 模糊 处 理 
color += weight*gInputMap.SampleLevel( 
gsamPpointClamp, tex, 90.0); 








totalWeight += weight; 
} 
} 


// 使 总 权重 之 和 为 1， 以 弥补 被 忽略 而 未 计 入 统计 的 样本 
return color / totalWeight; 
} 








图 21.8 所 示 的 即 为 经 边缘 保留 模糊 处 理 后 的 环境 光 图 。 





| SSAO Demo FPS:204 Frame Time: 490196 (ms) ED) 
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图 21.8 经 保 边 模糊 对 噪点 进行 平滑 处 理 后 的 效果 。 在 演示 程序 中 ， 共 对 图 像 进 行 了 3 次 模糊 处 
理 














21.2.4 ”使 用 环境 光 让 珊 图 


到 此 为 止 ， 我 们 已 经 构造 出 了 环境 光 遮 丽 图 ， 最 后 的 步骤 就 是 将 其 
应 用 到 场景 之 中 。 思 路 之 一 是 使 用 alpha 混 合 技术 ， 通 过 后 台 绥 冲 区 来 调 
整 环境 光 图 。 可是， 一旦 照 此 方案 去 做 ， 就 会 发 现 环境 光 图 要 变动 的 并 
不 只 是 环境 光 项 ， 还 要 波及 光照 方程 中 的 漫 反 射 项 与 镜面 反射 项 。 由 此 
可 见 ， 这 种 处 理 方 式 并 不 是 很 妙 。 因 此 ， 现 采用 如 下 策略 : 在 将 场景 泻 
染 到 后 台 绥 冲 区 时 ， 我 们 要 把 环境 光 图 作为 着 色 器 的 输入 。 接 下 来 再 
《以 摄像 机 的 视角 ) 生成 投影 纹理 坐标 ， 对 SSAO 图 进行 采样 ， 并 将 它 
应 用 至 光照 方程 的 环境 光 项 。 











// 在 顶点 着 色 器 中 ， 为 投影 场景 里 的 SSA0 图 而 生成 投影 纹理 坐标 


vout .SsaoPosH = mul(posN，8gViewProjTex ) ; 





// 在 像素 着 色 器 中 ， 完 成 纹理 投影 并 对 SSAO 图 进行 采样 





pin.SsaoPosH /= pin.SsaoPosH.w; 
float ambientAccess = gSsaoMap.Sample(gsamLinearClamp, pin.SsaoPosH.xy, 9. 
ef).r; 


// 根据 采样 数据 按 比例 缩放 光照 方程 中 的 环境 光 项 
float4 ambient = ambientAccess*gAmbientLight*diffuseAlbedo; 





图 21.9 所 示 的 是 应 用 了 SSAO 图 之 后 的 场景 效果 。SSAO 的 效果 可 能 
并 不 是 十 分 明显 ， 我 们 可 以 在 场景 中 反射 充足 的 环境 光 ， 以 此 提升 环境 
光 可 及 率 来 令 反 差 更 为 显 普 。 当 物体 位 于 阴影 之 中 时 ，SSAO 的 优点 则 
尤为 明显 : 此 时 ， 漫 反射 光 项 与 镜面 反射 光 项 纷纷 失效 ， 而 仅 表现 出 环 
境 光 项 。 若 这 时 不 采用 SSAO 技 术 ， 则 阴影 中 的 物体 会 因 恒 定 的 环境 光 
项 而 显得 没有 立体 感 ， 但 是 采用 了 SSAO 之 后 ， 它 们 仍 将 保持 3D 画 风 。 























图 21.9 ”本章 例 程 的 效果 。 由 于 SSAO 图 仅 影响 环境 光 项 ， 所 以 效果 不 太 明 显 。 但 是 ， 我 们 依然 
可 以 从 柱 体 和 方 盒 的 底 端 、 球 体 的 下 侧 以 及 骨 钥 关 的 周围 等 部 分 看 出 稍 显 偏 暗 








在 泻 染 观察 空间 中 场景 众 法 线 的 同时 ， 我 们 也 要 为 场景 构建 深度 组 
冲 区 。 因 此 ， 以 SSAO 图 第 二 次 洽 染 场景 时 ， 应 将 深度 检测 的 比较 方法 








改 为 “<EQUALS”。 由 于 只 有 距离 观察 点 最 近 的 可 视 像 素 才 能 通过 这 项 深度 
比较 检测 ， 所 以 该 检测 方法 就 能 有 效 防止 第 二 次 泻 染 过 程 中 的 重复 绘制 
Coverdraw ) 而 且 ， 在 第 二 次 演 染 过 程 中 也 无 须 问 深度 缓冲 区 执 
行 写 操作 ， 这 是 因为 我 们 已 经 在 法 线 演 染 目标 的 绘制 过 程 中 将 场景 深度 
写 入 了 深度 缓冲 区 








opaquePsoDesc .Depthstenci1lstate.DepthFunc = D3D12_COMPARISON_FUNC_EQUAL ; 
opaquePsoDesc.DepthStencilState.DepthWriteMask = D3D12_DEPTH_WRITE_MASK_ZE 


RO; 
ThrowIfFailed(md3dDevice->CreateGraphicsPipelinestate( 
&opaquePsoDesc, IID PPV ARGS(&mPpSOs["opaque" |]))); 





21.3 ”小 结 





1. 光照 方程 中 的 环境 区 项 模拟 了 间接 光 。 在 我 们 所 采用 光照 模型 
中 ， 环 境 光 项 仅仅 是 一 个 利 量 。 因 此 ， 当 物体 在 阴影 之 中 或 者 仅 有 环境 
光照 射 其 表面 时 ， 模 型 就 会 因 单 一 颜色 体现 不 出 物体 实体 形状 〈solid 
definition) 而 显得 扁平 化 、 不 立体 。 环 境 光 遮蔽 技术 的 目的 就 是 为 环境 
光 项 找寻 一 个 更 佳 的 估算 方法 ， 使 得 物体 只 使 用 环境 光 项 也 能 富有 立体 
感 。 


2， 间 接 光 遮蔽 的 实现 思路 是 ， 物 体 表 面 上 一 点 P 所 接收 到 的 间接 光 
量 ， 与 照射 到 以 点 了 为 中 心 的 半球 的 入 射 光 量 成 正比 。 一 种 估算 点 了 遮 责 
率 的 方式 是 投 冉 光 线 : 我 们 从 后 P 同 以 点 P 为 中 心 的 半球 随机 投射 光线 ， 
并 检测 它们 与 周围 网 格 的 相交 情况 。 如 果 这 些 光线 没有 与 任何 几何 体 相 
交 ， 那 么 就 认为 点 P 完 全 没有 被 遮挡 住 。 但 是 ， 大 存在 许多 光线 与 网 格 
相交 的 现象 ， 我 们 则 认定 点 P 被 场景 中 的 物体 遮挡 严重 。 


3. 对 于 动态 物体 的 实时 泻 染 来 讲 ， 通 过 光线 投射 法 来 进行 环境 光 
遮蔽 过 于 浪费 。 相 对 而 言 ， 屏 人 幕 空间 环境 光 氮 英 “SSAO) 技术 则 是 一 
种 基于 观察 空间 法 线 与 深度 值 的 实时 通 近 算法 。 虽 然 我 们 确实 可 以 看 出 
因 这 种 技术 的 错误 结果 所 导致 的 一 些 瑕 疯 与 状况 ， 但 对 于 条 件 相 对 有 限 
而 仍 要 计算 遮蔽 数据 的 情况 来 襄 ， 这 仍 是 一 种 实践 效果 极 好 的 解决 方 


案 。 











21.4 ”练习 


1. 试 借助 网 络 研究 KD 树 、 四 又 树 〈quadtree) 与 八 又 树 


(Coctree ) 。 


2. 修改 “SSAO”《“ 屏 幕 空间 环境 光 遮 丽 ) 演示 程序 ， 以 高 斯 模糊 取 
代 其 中 的 边缘 保留 模糊 。 试 问 ， 哪 种 方法 更 佳 呢 ? 


3. 能 否 用 计算 着 色 器 来 实现 SSAO 呢 ? 如 果 可 以 ， 试 给 出 大 致 的 实 


现 步 又。 


4. 图 21.10 所 示 的 是 我 们 不 进行 自 相 交 检 测 〈self-intersection， 人 参见 
21.2.2.4 节 ) 所 生成 的 SSAO 图 。 试 修改 “SSAO” 例 程 ， 去 挥 其 中 的 自 相 
交 检 测 以 欣赏 图 21.10 所 示 的 效果 。 





SSAO Demo FPS: 228 Frame Time: 4.38596 (ms) 




















图 21.10 ”到 处 都 是 错误 的 遮蔽 效果 





[1] 此 程序 的 完整 代码 详 见 本 书 上 一 版 附件 d3d11CodeSet3.zip 里 的 
Chapter 22 Ambient Occlusion/AmbientOcclusion 工 程 。 上 述 代码 也 是 出 
自 于 此 。 





[2] ”该 词 常用 于 音频 处 理 方面 ， 此 处 意 为 采样 较 少 〈 仅 为 完整 分 辩 率 的 
1/4， 采 样 间隔 大 ) ， 也 就 是 采样 频率 低 的 特效 。 


第 22 章 ”四 元 数 革 | 





我 们 在 第 1 章 中 曾 介绍 过 一 种 名 为 癌 量 《矢量 ) 的 数学 对 象 。 还 特 
意 学 习 过 由 有 序 实数 三 元 组 所 构成 的 3D 疝 量 ， 并 用 它 来 定义 在 几何 学 
中 十 分 有 用 的 向 量 运算 。 此 外 ， 亦 有 如 第 2 半 中 讲解 的 矩阵 一 一 这 是 一 
种 以 实数 排列 而 成 的 矩形 表 ， 由 它们 定义 的 多 种 运算 在 几何 学 上 也 必 不 

可 少 。 比 如 说 ， 我 们 曾 验证 年 阵 可 以 表示 线性 变换 与 仿 射 变换 ， 并 将 年 
阵 乘 法 用 于 多 种 变换 的 复合 。 在 本 章 中 ， 我 们 将 考察 一 种 名 为 四 元 数 
(quaternion) 的 数学 对 象 。 在 此 ， 我 们 将 看 到 单位 四 元 数 (unit 
quaternion) 可 用 于 表示 3D 旋 转 ， 并 具有 便利 的 插值 性 质 。 对 于 希望 在 
四 元 数 《〈 及 其 旋转 变换 ) 方面 有 更 深入 理解 的 读者 ， 我 们 诚挚 地 为 您 推 
荐 此 主题 相关 的 书籍 [Kuipers99]。 











学 习 目 标 : 





温习 复数 知识 并 回顾 如 何 用 复数 的 乘法 运算 来 表示 平面 内 的 放 
转 操作 。 





2. 理解 四 元 数 及 其 基本 运算 的 定义 。 
3. 探索 如 何 用 一 组 单位 四 元 数 来 表示 一 系列 3D 旋 转 操作 。 


4. 研究 如 何在 各 种 不 同 的 旋转 表示 法 之 间 进 行 转换 。 


5. 学 习 如 何在 单位 四 元 数 之 间 进 行 插值 ， 并 理解 这 在 几何 学 上 等 
同 于 在 3D 方 同 之 间 进 行 插值 。 


6. 熟悉 DirectXMath 库 中 与 四 元 数 相 关 的 函数 与 类 。 


22.1 复数 回顾 


四 元 数 (guaternion) 可 被 视 为 复数 的 推广 ， 这 便 是 我 们 在 开始 学 
习 四 元 数 之 前 先 回 顾 复数 的 原因 。 特 别 地 ， 我 们 在 本 节 的 主要 目标 是 证 
明 复 数 pP (可 看 作 一 个 2D 疝 量 或 2D 点 ) 与 单位 复数 相 乘 的 结果 ， 即 为 在 
几何 学 上 对 P 进 行 相应 的 旋转 操作 。 而 在 22.3 节 中 ， 我 们 还 将 证 明 : 
个 特定 的 四 元 数 与 一 个 单位 四 元 数 〈unit quaternion ) 乘积 的 结果 ， 就 相 
当 于 在 几何 学 上 对 一 个 回 量 或 点 P 执 行 对 应 的 3D 旋 转 操作 。 











22.1.1 定义 


从 不 同 的 角度 去 看 ， 复 数 的 解释 方式 可 请 五 花 八 门 。 由 于 一 见 到 它 
束 会 使 我 们 立即 联想 到 2D 扣 或 2D 向 量 ， 那 么 我 们 不 妨 束 以 这 样 的 方式 
来 介绍 它 吧 。 


有 序 实数 对 z = (a, 5) 表 示 一 个 复数 。 其 第 一 个 分 量 名 为 实 部 (real 
part) ， 第 二 个 分 量 则 称 为 虚 部 (imaginary part) 。 据 此 ， 复 数 相等 、 
加 法 运算 、 减 法 运算 、 乘 法 运算 以 及 除法 运算 的 定义 依次 为 : 


1. (la. b)={c ,dd), 当日 仪 当 a = cHb= 人 
9. (a, 四 十 {c. dj) 二 (a 土 c. b 土 d), 


3, la, ble, d) = (lac — bd, ad + be), 


ac 十 pa pc 一 到 | 
D 


(a.b) 
J c2 oe a2 ) c2 + 


那么 (c', dj 





4. 如 果 (c， d) (0. 0), 
我 们 可 以 轻易 地 证 明 出 实数 常见 的 算术 性 质 ( 例 如 交换 律 、 结 合 律 
以 及 分 配 律 ) 也 适用 于 复数 运算 。 这 一 有 具体 应 用 可 参见 本 章 练习 1 


形 如 (7,0) 的 复数 通常 直接 以 实数 z 来 表示 ， 并 记 作 7 = (7,0)。 这 样 一 
通过 观察 可 以 发 现 ， 实 数 与 复 
?7 给 出 。 对 

















来 ， 任 何 实 数 都 可 看 作 虚 部 为 0 的 复数 
数 的 乘积 可 由 zta， b)= (rz.0)(a.b) = (za, 7b) = (a,b)(z,0) 
此 ， 读 者 有 没有 联想 起 标量 和 癌 量 之 间 的 乘法 运算 呢 ? 
。 根 据 复 数 的 乘法 定义 ， 
这 表明 i = VvV 一 1。 也 就 是 说 ,为 


定义 虚数 单位 (imaginary unit) 7 = (0,1) 
) = (—1, 0) 


可 得 到 i? = (0, 1)(0, 1) = 
方程 r* = 一 1 的 解 。 
复数 z = (a,b) 的 共 固 复数 (complex conjugate〉 记 作 z， 并 表示 为 
复数 除法 公式 的 一 种 简便 助 记 方 法 是 为 分 子 和 分 母 同 时 乘 
了 驶 成 为 了 一 个 实数 : 


ac 十 pad pc 一 ) 
9D 


”cc2 十 好 2 


去 三 (C 
以 分 母 的 共 思 复数 。 如 此 一 来 ， 分 母 部 分 
(ac + bd.bc— ad) 


(a,b) (c,—d) 
c2 十 dz 


[ca) (c, —d) 本 
可 以 写作 a 十 万 的 形式 。 假 设 已 知 








(a.b) 
(c.d) 


接 下 来 ， 我 们 证 明 复 数 (a 
a = (a,0).b = (4b.0) (0. 1), 则 有 
a+iw= (a,0)+(0,1)(4,.0) = (a,0) + (0,.68) = (a,b) 
通过 (a + 0 的 形式 ， 我 们 可 以 将 复数 的 加 、 减 、 乘 、 除 四 则 运算 重 


新 定义 为 : 


1]. (aa 十 如 十 (c++idj = 二 (a 土 c) 十 i(b 土 d)， 


2D， (a 十 ib) (ct+id) = (ac— bd)+i(adt+ bce), 


a+ib ac 十 bd pc 一 ad 


3， 如 果 (c 四 #(0,0)， 那 么 c 十 这 一 到 十 到” C+ 











另外 ， 在 这 种 形式 下 ，z = “十 埃 的 共 斩 复 数 则 为 三 = a 一 ib。 


22.1.2 复数 的 几何 意义 


复数 的 有 序 实数 对 形式 4 十 也 = (a,?)， 使 我 们 自然 而 然 地 将 复数 与 
几何 学 中 复 平 面 内 的 2D 点 或 2D 回 量 联 系 到 一 起 。 事 实 上 ， 复 数 加 法 运 
算 的 定义 与 向量 加 法 的 定义 一 致 ， 如 图 22.1 所 示 。 在 下 一 节 中 ， 我 们 将 
给 出 复数 乘法 运算 的 几何 意义 。 

复数 a 十 放 的 绝对 值 (absolute value) 或 称 为 模 (magnitude) 可 由 
对 应 向 量 的 长 度 来 予以 表示 《〈 见 图 22.2) ， 可 通过 下 式 来 求 得 此 值 : 


la+ib|= vat+ 





如 果 一 个 复数 的 模 为 1， 我 们 就 称 它 为 单位 复数 (unit complex 


number) 。 








图 22.2 ”复数 的 模 


22.1.3” 极 坐标 表示 法 与 旋转 操作 


由 于 可 以 将 复数 视 作 2D 复 平面 内 的 点 或 回 量 ， 因 此 我 们 就 能 将 它 
们 的 分 量 用 极 坐 标 〈polar coordinate ) 来 表示 ， 如 图 22.3 所 示 。 
六 一 | 十 | 


a+ib=rcos0O+irsinG=r(cos0 +1ising) 


等 式 右 侧 称 为 复数 a 十 友 的 极 坐 标 表 示 (polar representation ) 。 





我 们 下 面 以 极 坐标 的 形式 来 表示 两 个 复数 的 乘法 运算 。 设 
之 ] 一 7 (cos 01 十 1 sin01) 以 及 z2 = 7 of COS DO， 十 isin 02), 则 有 


zl1z2 = T17292(COS OQ1c0s 0 — sinQ1sinGs++ilcosO1sings + sinO1cos0s)) 
二 TITo(cos(01 十 85) 十 7sin(081 十 92)) 


推导 过 程 中 我 们 运用 了 三 角 恒 等 式 
sin(a + B)= sinacosB+cosasing 
cosla + [3)= cosacosB— sinasing 
因此 ， 从 几何 学 角度 上 来 看 ， 乘 积 zlz? 所 得 到 的 复数 可 表示 为 由 模 
为 m1"2 且 与 实 轴 夹 角 为 91 + 92 的 辐 量 。 特 别 地 ， 如 果 72 = 1， 则 
Zl1 X22 一 7 (cos (0 十 905) 十 71sin(091 + 90,)) ， 在 几何 学 上 上 即 表 示 将 红 按 92 进 行 
旋转 ， 如 图 22.4 所 示 。 因 此 ， 将 复数 z1 (把 它 视 为 一 个 2D 点 或 2D 辣 
量 ) 与 单位 复数 z2 相 乘 就 相当 于 对 1 进行 旋 转 操 作 。 





+y 


a+ib=rcos0+irsing 





b=rsing 





图 22.3 一 个 复数 的 极 坐 标 表示 





图 224 zl 三 7T1(C0S 01 十 2singl)j，z2 二 (cos 02 十 17sin go)。 乘 积 z1z2 就 相当 于 将 之 1 按 
角 92 进 行 旋转 


22.2 ”四 元 数 代数 


22.2.1 定义 与 基本 运算 


we 
通常 可 将 它 简 记 作 g = tu ww) = (zy 2 w)， 称 w= (7, y, 2 为 虚 部 向 量 
(imaginary vector partt， 虚 癌 量 部 分 ) ， 而 w 为 实 部 。 据 此 ， 四 元 数 相 
等 、 加 法 运算 、 减 法 运算 、 乘 法 运算 的 定义 如 下 。 


1. (wu, a) = (v, b), 当日 仪 当 w = vHa = 5。 
9， (vu, dj) 土 人 ,划一 ( 土 D，Q 士 人 。 


3, (u, lv, b)= (av+but+u x v, ah ou v), 


管 四 元 数 乘法 运算 的 定义 看 起 来 似乎 有 扣 “ 奇 栈 ”*"， 但 这 确实 是 不 
争 的 事实 。 虽然 如 此 ， 我 们 却 可 以 根据 这 些 定义 来 推导 它 的 其 他 定义 形 
式 ， 而 这 推导 的 结果 会 更 便于 使 用 。 下 面 我 们 就 来 将 四 元 数 之 间 的 乘法 
定义 为 矩阵 的 乘法 。 








设 P= (vu, DJ = LP1 Po, P3, PI 以 及 gq = (9 = (41， 4，43， 44)。 那 
人 ux v= (p2g3 — Pp3q2, P31 — P193; P192 一 padljl2]， 日 
9 二 也 十 P22 十 P343。 现 在 ， 四 元 数 乘积 " = pq 束 能 够 表示 为 以 下 的 


分 量 形式 : 


71 = P4491 + 44p1 + P293 — P392 = 41P4 — 92P3 十 dp2 十 44P1 
72 = P492 + 94p2 + P3941 — P1493 = 941P3 — 92P4 + 93p1 + 44p2 
73 = P443 + 44p3 + P142 — P241 = —q1P2 + q2P1 + 43P4 + 44p3 
74 = p444 — P141 — P292 — P343 = 一 41P1 — 42P2 一 43P3 + 44p4 


这 可 以 写作 和 矩阵 的 乘积 : 





p4 -Pp3 Pp2 Pl| |dl 
p3 p4 一 Dll P| |q2 
-p22 Pl p4 Pp3 gd3 
pl p2 p3 PpP4 d4 





注意 Ne > 


如 果 读 者 更 偏爱 使 用 行 向 量 与 矩阵 的 乘积 形式 ， 那 么 就 可 简单 地 取 
其 转 置 矩阵 : 








下 工 T 
p4 -Pp3 Pp2 Pl dl d1 Pp4 -p33 PP PI 
p3 p4 一 pl Pp2 如 | p3 p4 一 pl P2 
-p22 PI p4 D3 43 d3 一 po2 Pl p4 PDP3 
pl p2 p3 p14 d4 d4 pl p2 Pp3 P4 


22.2.2 ”特殊 乘积 


设 i = (10.0.0)，7 = (0,1,0,0)， 上 = (0,0,1,0) 都 为 四 元 数 。 运 用 这 三 
个 数 ， 便 能 得 到 一 些 特殊 的 乘积 ， 其 中 一 部 分 会 使 人 联想 到 又 积 计算 : 


i2 72 天 2 





上 一 


ijk 





22.2.3 ”人 性质 


四 元 数 乘法 并 不 满足 交换 律 ， 例 如 ， 我 们 在 22.2.2 节 中 曾 证 明 
J = 7。 但 是 四 元 数 仍 满足 结合 律 ， 这 能 从 四 元 数 乘法 可 以 写作 矩阵 
乘法 这 一 点 看 出 : 因为 矩阵 乘法 就 满足 结合 律 。 可 将 四 元 数 
e= (0.0.0, 1 看 作 乘 法 单位 元 (multiplicative identity) : 








p4 —p3 pp pi 0 1] 0 0 0| pi pl 

ye p3 p14 一 pl zm | 10 加 0 1 0 0||p _ |P2 
一 pz pI pi Pp3| 10 00 1 0| |ps p3 

Pl —p» 一 pa Pp4| |1 0 0 0 1| |p Pa 


我 们 还 能 得 出 四 元 数 乘法 对 加 法 的 分 配 律 :Plg +7) = Pq +Pr 以 及 
(gq +7)P= 4pP+7P。 为 证 明 此 性 质 ， 可 将 四 元 数 的 乘法 与 加 法 都 写作 秆 
阵 形式 ， 男 据 窍 阵 乘 法 对 加 法 的 分 配 律 便 可 证 明 。 


22.2.4 ”转换 


我 们 将 实数 、 向 量 〈 或 点 ) 与 四 元 数 的 关系 表达 如 下 。 设 s 为 一 个 
实数 ， 且 = (7,y, 3) 为 一 个 向 量 ， 那 么 : 


1. s= (0,0,0,s), 


本 


换言之 ， 可 将 实数 看 作 癌 量 虚 部 为 0 的 四 元 数 ， 而 把 同 量 视 为 实 部 
为 0 的 四 元 数 。 特 别 是 四 元 数 单 位 元 (identity quaternion) ，1 = (0, 0, 0， 
1)。 我 们 把 实 部 为 0 的 四 元 数 称 为 第 由 元 数 (pure quaternion ) 。 


根据 四 元 数 的 乘法 运算 定义 可 知 ， 一 个 实数 与 一 个 四 元 数 相 乘 其 实 
就 是 一 种 “标量 乘法 ”， 而 且 这 种 运算 还 满足 交换 律 ; 
5s 0 0 0| |p 
0 s 0 0 p2 


0 0 s 0| ps 
0 0 0 s| |pa 


s{p1, p2, Pp3, Pp4) = {0,0,0,s)(p1, p2, p3, PpP4) = 


spl 
sp2 
sp3 
sp4 
类 似 地 ， 


p4 一 p3 pp pl 0 
\ 国 rn lp Pp -zl|I0l 
(D1， p2, p3, P4)s = (Pp1, po, p3, P4)(0.0.,0,s) = eo en ps 


pl p22 一 p3 Pa4j |s 





Sp1 
SPD2 
SPD3 
Sp4 


22.2.5“” 共 斩 与 范 数 


我 们 将 四 元 数 9 = (4q1;42;43;44) = (ud) 的 共 斩 四 元 数 记 作 g*， 它 的 
定义 为 : 


q* = —qi— q2— 43+4q4 = (—u,q4) 


换 句 话说 ， 仅 是 把 原 四 元 数 的 癌 量 虚 部 变 为 其 相反 数 而 已 ， 这 与 复 
数 共 斩 的 定义 很 相似 。 以 下 所 列 的 是 一 些 共 斩 四 元 数 的 相关 性 质 : 


1. (Pq)* = q+* p*。 

2. (P+ q)*= DpD*+q*,。 

3. (gq*)*= 4g。 

4. 当 s € 民 时 ，(sq)* = sq*。 

5, q+gq*=(u,g)+(—u,q4) 一 10, 204) = 2q4, 

6. q+ =q*+q=4+@B+B+R= ul + 

特别 是 ，g + q+ 与 94* 这 两 种 运算 的 结果 为 实数 。 

四 元 数 的 范 数 norm， 或 称 模 ，magnitude) 被 定义 为 : 


吗 十 性 十 县 + 帮 = Vu + 





llal| = Var = 


如 果 一 个 四 元 数 的 范 数 为 1， 我 们 束 称 它 是 一 个 单位 四 元 数 (unit 


quaternion ) 。 范 数 具 有 下 列 性 质 : 
1. lla *||= llall, 


2. lpal| = lipllllall, 


性 质 2 反映 出 两 个 单位 四 元 数 的 乘积 仍 是 一 个 单位 四 元 数 。 而 且 ， 
如 果 |lpll = 1， 那 么 lpal| = llall。 


四 元 数 共 思 与 范 数 的 性 质 能 够 直接 由 其 定义 推导 出 。 例 如 : 
(g*)* = (—u,g4)+* = (wu.q4)=gqg 
la *|| = |(—u, ql| = V | -ull +g? = Villull +gq4 = lall 
lpqll” = (pq)(pq)* 
= Pqq + D+* 
= pllall'p* 
= pp * |lgl|* 
= |lpll "lal" 


读者 可 以 尝试 对 其 他 的 性 质 进行 推导 (参见 章 后 练习 )。 
22.2.6 ”四 元 数 的 逆 


与 矩阵 一 样 ， 四 元 数 的 乘法 运算 亦 不 满足 交换 律 ， 因 此 也 就 无 法 定 
义 四 元 数 的 除法 运算 (只 有 在 乘法 满足 交换 律 时 ， 才 可 以 定义 其 相应 的 
除法 运算 ， 即 有 5 “一 “) 。 然 而 ， 每 个 非 零 四 元 数 nonzero 
quaternion， 零 四 元 数 的 每 个 分 量 儿 为 0， 都 有 其 相应 的 闭 。 设 


= (q1;q2;43;44) = (w,q4) 为 一 非 零 四 元 数 ， 那 么 它 的 逆 被 记 作 4 一 ， 其 定 
义 为 : 
1 
el 


四 元 数 之 逆 的 检验 十 分 方便 ， 对 此 ， 我 们 有 : 





2 
qq* llgll 














qq = 一 了 一 一 一 1 一 (0;.0.0,1) 
llall -llall 
* 

0 al _ 1 (0, 0.0.1) 
lall -lal 


可 以 发 现 ， 如 果 % 是 一 个 单位 四 元 数 ， 那 么 lel = 1， 因 此 g ! = qx* 


四 元 数 的 逆 具 有 下 列 性 质 : 


1. (9!) ”= 9. 


22.2.7” 极 坐标 表示 法 


如 果 g = (q1; 42;43;44) = (4,44) 为 一 个 单位 四 元 数 ， 那 么 


7 7 : 
la = lu +q1 =1 





这 说 明 Q 1 全 |q| 1 分 -1< q4 < 1。 图 22.5 展 示 了 存在 这 样 一 
角度 9 < [0,7] 使 44 = cos 8。 根据 三 角 恒等式 sin?09 + cos*9 = 1， 有 





sin28 =1— cos0=1—-9= |ul 


束 意 味 大 


lu = |sin98| = sin98， 其 中 9 € [0,7] 





现在 ， 将 nn 表示 为 与 向 量 u 同 方 同 的 单位 癌 量 : 


u u 


lul| sing 


7 一 





因此 ，w = sn6n。 据 此 ， 我 们 就 能 够 把 单位 四 元 数 4 = 


(u, q4, ) 表 示 
为 极 坐 标的 形式 ， 其 中 的 n 为 一 时 位 同 量 : 


q = (sin9n,cos9)， 其 中 9 E [0,7] 





/3 
q io] 
例如 ， 假 设 我 们 指定 一 个 四 元 数 GC “”/。 为 将 其 转换 为 极 


n= = (0,1,0) 
2 Sn 6 
0) 


/3 


一 十 一、 Nr 0 =arccos -= 
坐标 表示 法 ， 我 们 求 得 ”2 6 





| 
ee 
| 
包 
jd 
已 
| 


= [sin 5(0; 1.0). coOs 二 
a : 


0 








图 22.5 对 于 Y E [一 1，1| 而 言 ， 必 存在 一 个 角 98 使 Y/ 一 cosB 


注 意 Note pe 


9 € [0,7] 是 将 四 元 数 g = (41,42;43;44) 转 换 至 极 坐 标 表示 法 的 限制 条 
件 。 也 就 是 说 ， 为 了 把 一 个 唯一 的 角度 与 四 元 数 9 = (gl 42;43,44) 相 关 
联 ， 便 需要 对 其 范围 进行 约束 。 如 果 推 翻 此 限制 ， 求 取 任意 角度 所 对 
应 的 四 元 数 g = (sin en,cos9)， 根 据 q = (sin (6 + 2rmjn,cos(9 + 2rm)) 可 
知 ，m 取 任意 整数 均 可 得 到 四 元 数 g9 = (sin8n,cos8)。 所 以 ， 如 果 没 有 
9 & [0, 7 这 个 角度 限制 ， 那 么 四 元 数 的 极 坐标 表示 就 不 是 唯一 的 。 








值得 注意 的 是 ， 以 -9 代 蔡 9 束 相 当 于 把 四 元 数 的 回 量 虚 部 变 为 其 相 
肥 数 : 





(nsin(—0).cos(—0)) = (—nsing.cos0) 一 万 # 





在 下 一 节 中 ， 我 们 将 认识 到 m 表 示 的 是 旋转 轴 ， 因 此 我 们 可 以 通过 
上 述 方法 调转 旋转 轴 的 方向 ， 使 被 旋转 对 象 按 相 反方 癌 进 行 旋转 。 





22.3 ”单位 四 元 数 及 其 旋转 操作 


22.3.1 ”旋转 算 子 








设 9 = (w, WW) 为 单位 四 元 数 ， 而 ov 为 一 个 3D 点 或 3D 向 量 。 接 下 来 ， 我 
们 就 可 以 把 v 视 为 纯 四 元 数 P = (vw,0)。 又 因为 4 是 一 个 单位 四 元 数 ， 根 据 
其 性 质 ， 我 们 有 4 ”= g*。 回 顾 四 元 数 的 乘法 运算 公式 可 知 : 


(772.aQj(72.D) 一 (am 十 0 十 7 X7.ab 一 772 72) 
现在 来 考虑 下 列 乘积 : 
qpq " = gqpq+* 
= (Uw)(v.0)(—u, ww) 
= (uw ww vxXUv:.u) 








对 这 个 稍 有 点 宛 长 的 公式 进行 化 简 ， 我 们 将 其 实 部 与 向 量 虚 部 分 开 
处 理 ， 用 下 列 符 号 分 别 痊 换 式 子 中 的 对 应 项 : 





T=WUV UxXU 


4 
KE 


ab 一 9772. 72 

一?20(D :UN) 一 MOD 一 XU 
=wWVU) UV+U (vxu) 
=wv uu) wv:u)+0 

二 0 








注意 ， 2 lv Xx 4) = 0 是 因为 根据 叉 积 的 定义 可 知 (vw x WwW 正 交 于 wu。 
可 量 虚 着 


ani+bm+mxn 
=ww vxXU+v Utux (wo—vxu) 
wv wut(v- UUuU+uxw+ux (uxv) 
=w vuxww+v uutux w+ux (uxwv) 
=wv+2u x wv uu+ux (ux wv) 
=wv+2u x w+ vu vu uu)v 
= (wu uv + x vv) +2 vu 


= (wu +2 vu + wu x ov) 





在 这 个 过 程 中 ， 我 们 利用 了 癌 量 三 重 积 
a x (bxc)= (a:o)b— (a:b)c 来 变换 u x (wu x v)[3], 


这 样 ， 我 们 就 证 明 出 : 


gpgk = (0 一 wup+2u uiu+2olu x v).0) 


(22.1) 


可 以 看 出 该 结果 是 一 个 同 量 或 一 个 点 ， 因 为 其 实 部 为 0( 如 果 要 利 
用 该 算 子 对 一 个 向 量 或 点 进行 旋转 ， 那 么 满足 此 条 件 是 有 必要 的 一 一 其 
求 值 结果 必须 是 一 个 向 量 或 点 ) 。 因 此 ， 我 们 在 随后 的 公式 中 将 省 略 四 
元 数 的 实 部 。 





由 于 9 为 单位 四 元 数 ， 便 可 将 它 写 作 


9g=(sngm,cosg9)， 其 中 | = 1 有 日 2 E [0,7] 


再 把 它 代 入 式 (22.1) 中 : 


gpqg+* = (cos2 — sin’0)v +2(sinOn:v)sinOn +2cos0(sinOn x v) 


一 (cos29 — sin:0)v + 2sin2g(m .um 十 2cosgsinglm x wv) 
运用 三 角 恒等式 对 它 进一步 化 简 : 
Wp/ 二 人 人 / \ 
cos’0— sin 0 = cos(20) 
2cos0sing = sin(20) 
cos(20) = 1 — 2sin’*0 
gpg* = (cos’0 — sin29)uo + 2sin’0(n .um 二 2cosgsing 


= cos(20)v+ {lo—cos(20))(n:. vn+t+sin(20)(n x v) (22.2) 

将 式 〈22.2) 与 以 旋转 轴 及 旋转 角 表 示 的 旋转 式 (3.5， ， 进 行 比 对 
可 以 发 现 : 前 者 其 实 就 是 旋转 公式 Rntv)。 换 言 之 ， 式 (22.2) 令 向 量 
(或 点 ) v 绕 轴 n 按 角 29 进 行 旋转 。 


Ri(v) 一 cosgu 十 (1 一 cosgjlm .VD)m 十 SnO(7 x wv) 


因此 ， 我 们 定义 四 元 数 的 旋转 算 子 (rotation operator) 为 : 


Ralv) 一 dog | 


一 QUDd# 


= cos(20)v+ (1 ocos(20)(n:. vn+t+sin(20)(n x v) 


(22.3) 
我 们 方才 证 明了 四 元 数 旋 转 算 子 Ra(v?) = gzg 将 向 量 (或 点 ) v 线 


轴 n 旋 转角 29。 
所 以 ， 耕 给 定 一 个 旋转 轴 n 以 及 旋转 角 9， 我 们 就 能 通过 下 式 构 建 出 
相应 的 旋转 四 元 数 : 
] TL.COS a 
-Ce) 
接着 ， 再 运用 公式 fta(t?) 即 可 得 到 对 应 旋转 算 子 。 我 们 在 这 里 将 旋 


转角 度 除 以 2 是 为 了 与 公式 中 的 298 相 抵消 ， 这 是 因为 我 们 希望 旋转 的 角 
度 为 2， 而 非 29。 





22.3.2 ”将 四 元 数 旋转 算 子 转换 为 窍 阵 形式 


设 g = (ww, 如) = (q1; 2; 43;44) 为 单位 四 元 数 。 根 据 式 《22.1)〉 可知 : 


7 = Rg(v) = qvqg+ = (wou) v2 vu + 2 x v) 


注意 到 由 和 二 多 二 十 二 1 (单位 四 元 数 的 范 数 为 1) 可 得 
qf 一 1= 一 4 一 稼 一 BB， 因 此 








2 \ 2 2 2 2， 
(Ww uu)v = (gq — 4 -gv 


一 (241 — 1)v 


Rs(o) 中 的 三 项 可 以 分 别 写作 矩阵 形式 ; 


2gt 2d1q2 2d193 
2(u .ou = [vr vy tu |2q1q2 29 2q2q3 
2q1g3 2qd243 293 


0 29493 ”一 20402 
2w(u x v) = [vr vy Du: | 一 24443 0 2q191 
24442 ”一 24441 0 
对 这 三 项 求 和 ， 得 到 : 
2q1 +244 一 1 2g1g2 + 2q3g4 249193 一 2q244 
Rv) = vQ = [vr vy v:] |29192 一 293q4 2 2 二 24243 十 24 q4 
24143 十 24244 29243— 24194 293 十 204 一] 
Os 2，2， 2 2 
根据 单位 四 元 数 g 的 单位 长 度 性 质 和 十 呈 十 呈 十 王 二 1 可 知 : 


2g1 十 204 = 2 — 2g2 — 2g3 
2qg2 + 2g? = 2 — 2g? — 2g2 

d2 d4 d1 d3 
9.2 9.2 5 口 “2 口 “了 
243 + 244 = 2 — 241 一 292 


因此 ， 我 们 可 以 将 矩阵 方程 改写 为 : 


1 — 2g7 — 2g3 2q1g2 + 24344 29193 — 2q2q4 
RA(v) = vQ = [vr vy v:] |29192 — 243g4 1— 2g1 — 2g3 2q2g3 + 2q1q4 
2qg1g93 + 2g244 29293 — 2q194 1— 2g? — 2g2 


(22.4) 


注意 Note ge 








许多 图 形 学 书籍 为 了 对 向 量 进行 变换 而 采用 矩阵 与 列 癌 量 乘积 的 形 
式 。 因 此 ， 在 东 些 图 形 学 闭 作 中 ， 我 们 会 看 到 以 矩阵 @ 的 转 置 矩 阵 所 表 


示 的 公式 Ry(v) = QTo7。 
22.3.3 ”将 旋转 矩阵 变换 为 四 元 数 旋转 算 子 
给 出 旋转 矩阵 


R= IR2l Rr PR23 


Ra R32 fia3 





Ri R12 | 





我 们 希望 能 求 出 四 元 数 g = (4q1,42;,43,44)， 使 得 我 们 在 用 4 来 构建 式 
(22.4) 中 的 矩阵 @ 时 得 到 的 是 算 阵 尺 。 因 此 ， 这 里 采取 的 宋 略 是 设 : 


ee, oe 
Ro R22 Ro3 2q192 — 29394 1— 291 — 293 294293 + 29194 


Ru Ri R13 1 — 2g7 — 2g3 2g1g2 十 2g3q4 29193 一 2q2q4 
Ra Ra Pa3 


2d143 + 2q244 2q243 — 2q144 1— 2gi1 一 202 


再 分 别 解 出 、 吕 、48、4Q4。 注 意 ， 由 于 在 开始 时 给 出 了 窍 阵 及， 因 
此 方程 左 侧 的 所 有 元 素 都 是 已 知 的 。 








首先 对 位 于 矩阵 主 对 角 线 上 (左上 至 右 下 ) 的 元 素 求 和 (此 和 也 称 
为 矩阵 的 迹 ，trace) : 





trace( R)=Ri11 十 Ro» + R33 
=1—2g—2g+1—2g 29+1—2g!—2g 





=3— 4g1 — 4g2 — 4q3 
=3— 4(gi+ gq2+g3) 
=3—4(1— @g) 

一 一 1 + 4g1 


Vtrace(R)+1 
.44 = 5 





现在 来 组 合 官 阵 主 对 角 线 两 侧 的 对 称 元 素 以 求 取 4 、 吧 、 鱼 《因为 在 
上 述 计 算 的 过 程 中 消去 了 这 几 项 ) : 





R23 — R32 = 29293 + 24144 一 29293 + 29194 


= 491944 

a Rs 一 Pa 

2 一 dq 
R31 一 fe13 = 29193 + 29244 一 24193 + 2q2q4 
= 4q2q4 

| Ra 一 R13 

.0 = 一 -一 一 

494 

R12 — R21 = 29192 + 29344 — 29192 + 29344 
= 4qg3q4 

| R12 一 Ral 

413 加 494 


如 末 和 =0， 那 么 这 些 公式 皆 无 定义 。 右 发 生 这 种 情况 ， 应 找到 托 
阵 及 主 对 角 线 上 的 最 大 元 系 来 计算 被 除数 ， 并 将 其 他 和 矩 阵 元 素 以 为 一 种 
方式 进行 组 合 。 假 设 人 ll 是 窍 阵 主 对 角 线 上 的 最 大 元 系 : 











FE11 fm— Ra=1 2g2 2g3 1 十 2g7 十 2g2 一 1 十 2g7 十 2g2 
| 
二 一] 十 4q1 





. VRu1 — R22— R33+!]1 
.dl 二 5 


可 





R11 — R12 + R21 = 29192 + 29344 + 29192 一 293q4 
一 4q192 


R13 — R31 = 29193 — 24244 + 29294 


= 44143 
= R13 + Ral 
4q1 
Re23 一 R32 = 29293 + 29144 一 29293 + 291d4 
= 4q1q4 
| R23 十 R32 
.44 二 a 


如 果 主 对 角 线 上 的 最 大 值 为 Rw 或 Ra3， 则 进行 类 似 的 处 理 。 
22.3.4 复合 


假设 P 与 9 分 别 为 旋转 算 子 侣 与 人 中 所 用 的 相应 单位 四 元 数 。 设 
v' 二 Rp(v)， 那 么 这 两 个 旋转 算 子 的 复合 过 程 为 : 
RA(Rp(vV)) = Rv’) = qv'qg ! = q(pvp ')q 


(gp)v(gp) 
由 于 P 与 4 都 为 单位 四 元 数 ， 也 就 是 说 lIPqll = lipllliall = 1， 所 以 乘积 
P9 亦 为 单位 四 元 数 。 因 此 ， 四 元 数 乘积 Pg 也 表示 着 一 种 旋转 操作 。 换 名 


话说 ， 净 旋转 (net rotation〉 可 表示 为 旋转 算 子 的 复合 fa zt 路 。 


= (gp)v(p lg !) 


22.4 四 元 数 插值 


由 于 四 元 数 即 实数 四 元 组 ， 所 以 就 能 将 其 视 作 几何 学 上 的 4D 问 
量 。 单 位 四 元 数 则 是 位 于 4D 单 位 球面 上 的 4D 单 位 向 量 。 利 用 又 积 《〈 此 
运算 定义 仅 用 于 3D 向 量 ) 以 外 的 运算 规则 ， 我 们 就 能 将 向 量 的 数学 运 
算 推广 到 四 维 空间 乃至 n 维 空间 。 尤 其 是 适用 于 四 元 数 的 点 积 运 算 : 设 
四 元 数 P = (w,5) 与 9 = (v,， 那 么 





PpP:qg=u:v+st=|plllgllcos0 
其 中 ，9 为 这 两 个 四 元 数 之 间 的 夹 角 。 如 果 四 元 数 P 与 9 皆 为 单位 长 
度 ， 那 么 Pq = cos8。 这 就 是 说 ， 扣 积 使 我 们 可 以 描述 出 两 个 四 元 数 之 
间 的 夹 角 ， 作 为 它们 在 单位 球面 上 彼此 远近 程度 的 度量 手段 。 


考虑 到 3D 旋 转动 男方 面 上 的 需求 ， 我 们 希望 在 两 个 不 同 的 方 网 之 
间 进 行 插值 ， 求 取 中 间 的 变化 过 程 。 为 了 对 四 元 数 进行 插值 ， 我 们 就 联 
想到 对 单位 球面 上 的 弧 进行 插值 ， 这 样 一 来 ， 所 得 到 的 插值 四 元 数 依然 
古 单位 四 元 数 。 为 了 推导 出 这 样 一 个 插值 公式 ， 我 们 考虑 图 22.6 所 示 的 
情景 ， 在 这 里 ， 我 们 希望 在 a 到 b 之 间 的 角 t9 方 向 进 行 插值 。 此 时 ， 我 们 
的 目标 是 求 出 权重 cj 与 cz 使 = cla + czb， 其 中 pl =all = | 如。 现 为 两 
个 未 知 权 值 列 出 下 述 等 式 : 





a-:pP=ca:a+ca:b 
coslt9) = ci + co cos(0) 
pP:b=ca:b+i+cb:b 


cos({1—#t)0)=c1icos(0)+ cs 


a 


图 22.6” 沿 4D 单 位 球面 在 由 a 到 5b 的 角 t8 处 进行 插值 。a 与 5 之 间 的 夹 角 为 9，a 与 P 之 间 的 夹 角 
为 9， 而 P 与 b 之 间 的 夹 角 则 为 (1 一 9 


用 矩阵 方程 来 表示 为 : 


1 cos{@)| |al 加 cosltO) 
cos(0) ] co| lcos((1— 1)0) 


考虑 矩阵 方程 Az = 5b5， 其 中 的 窍 阵 A 是 可 逆 的 。 根 据 元 羔 姆 法 则 
(Cramer’s Rule) 可知，7i 二 det Ai/ det A， 用 列 向 量 b 替 换算 阵 4 中 第 ; 
列 的 列 问 量 即 可 得 到 Ai;。 因 此 : 


Je cosltO ) cos(0) 
“|cos((1 — #0) ] cos(lt0) — cos(0) cos((1 一 力 9) 


cl -一 -一 





| 1 ew 1 一 cos*(0) 
cos(0) 1 
| 1 z cos(t0) | 
| costO) cos({l—#0)| cos(ll—#)0)— cos(0)coslt0) 
人 det | 1 | 1 — cos2(0) 
cos(0) ] 


根据 毕 达 哥 拉 斯 三 角 恒 等 式 (trigonometric Pythagorean identity) 与 


加 法 公式 ， 我 们 有 : 


1] 一 cos2(9) = 
cos{{1 —+)0)= —10) = cos(0) cos(t0) + sin(0)sin(t0) 
sin((1 —1)0)= 0 — +0) = sin(0)cos(t0) — cos(0) sin(t0) 











因此 ， 
| cos{t0) — cos(0)[cos(0) coslt0) + sin(0) sin(t0)| 
3 sin*(0) 
cos({t0) — cos(0) cos(0) cos(t0) — cos(0) sin(0) sin(t0) 
sin2{O) 
cos(t0)(1 一 cos219)) 一 cos(9) sin(0)sin(t9) 
sin’(0) 
cos(t0)sin*(0) — cos(0)sin(0)sin(t9) 
sin*(0) 
sin(0)cos(t0) — cos(0) sin(t0) 
sin(0) 
sin((1 —#)0) 
sin(0) 
以 及 
| cosl9j cos(t0)+ sin(0)sin(t0) — cos(0)cos(t0) 
Ee sin’(0) 
sinltO ) 
sin(0) 


于 是 ， 我 们 就 定义 球面 插值 中 (spherical interpolation〉 公 式 为 : 


sin((1 ~—t)0)a+ sin(t0)b 


slerp(a.b.t) = oing ， 其 中 t € [0,1] 


将 单位 四 元 数 看 作 4D 单 位 同 量 ， 便 可 以 解 出 四 元 数 之 间 的 夹 角 


0 = arccos(la: b), 


如 果 a 与 b 之 间 的 夹 角 9 接 近 于 0， 那 么 sin9 也 接近 于 0， 因 此 有 限 的 数 
值 精度 会 引起 上 式 中 除数 为 0 的 问题 。 在 这 种 情况 下 ， 我 们 要 在 这 两 个 
四 元 数 之 间 进 行 线性 插值 ， 再 对 结果 执行 规范 化 处 理 。 此 时 ， 我 们 即 可 
得 到 6 较 小 时 的 一 个 极为 接近 的 插值 结果 《〈 见 图 22.7) 。 


观察 图 22.8， 其 中 展示 的 是 竺 完成 线性 插值 后 ， 再 将 插值 四 元 数 投 
影 回 单 位 球面 而 导致 的 非 线 性 旋转 速率 Cnonlinear rate of rotation) 。 这 
是 因为 我 们 对 夹 角 过 大 的 四 元 数 采 用 线性 插值 ， 从 而 导致 其 转速 忽 快 忽 
慢 ee 但 投影 至 球面 上 却 有 很 大 着 
异 ) 。 这 通常 并 不 是 我 们 所 期 待 的 效果 ， 同 时 也 从 侧面 反映 出 球面 插值 
更 受 仍 氛 的 原因 《球面 插值 使 旋转 速率 保持 恒定 ) 。 








pb 
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a 














图 22.7 对 于 a 与 b 之 间 夹 角 4 较 小 的 情况 ， 通 过 四 元 数 进 行 线性 插值 以 及 规范 化 线性 插值 即 可 
得 到 与 球面 插值 极为 近似 的 结果 。 然 而 ， 当 我 们 采用 线性 插值 时 ， 插 值 四 元 数 却 并 不 位 于 单 
球面 之 上 。 所 以 我 们 必须 对 结果 进行 规范 化 处 理 ， 将 它 投影 回 单位 球面 上 
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规范 化 处 理 后 ， 我 们 却 会 得 到 单位 球面 上 的 非 线性 插值 











图 22.8 在 对 四 元 数 进行 线性 插值 以 及 


结果 。 这 意味 着 旋转 速率 随 着 线性 插值 而 加 快 或 减 慢 ， 而 并 不 是 按 恒 速 旋转 
现在 来 讨论 一 种 四 元 数 的 有 趣 性 质 。 由 于 (sgj* = sg* 且 标量 与 四 元 


R-_a(v) = 
(—1)gv(—1)g+* 


数 乘法 运算 满足 交换 律 ， 我 们 就 有 : 
= gv(—q)* 


加 


一 GDG# 
因此 ， 我 们 就 得 到 了 四 元 数 g 与 四 元 数 -9 表 示 的 是 同一 种 旋转 这 一 
加 0 0 ) 


SIN — .COS— 
o) 0 


| 








， 那 么 
3 
—-q= | —nsins,— coss 
( ( 5 ) ( 3) 
一 | 一 msnl| 区 一 一 ].cos| 区 一 一 
2 2 
27 一 ) 27—0 
S1] COS ( )) 
2 


即 ，fia 绕 轴 n 旋 转角 9， 而 ff-o 绕 轴 -n 旋 转角 2x - 9。 从 几何 学 上 来 


看 ， 位 于 4D 单 位 球面 上 的 单位 四 元 数 q 与 其 极 坐标 相反 的 单位 四 元 数 -g 
表示 独 相 同 的 方向 。 图 22.9 展 示 的 束 是 这 样 的 两 个 旋转 结果 相同 的 四 元 
数 。 但 是 我 们 也 可 以 轻易 地 看 出 两 者 的 区 别 : 一 个 旋转 的 角度 较 小 ， 忆 
一 个 旋转 的 角度 过 大 。 











图 22.9 ”人 iq 绕 轴 n 旋 转角 9， 人 -gq 绕 轴 一 nn 旋转 角 2x+ 一 0 

















由 于 四 元 数 b 与 -b 表 示 的 是 同样 的 方向 ， 我 们 对 四 元 数 进行 插值 便 
有 了 slerpla.b.t) 与 slerpla, 一 z 思 两 种 选择 。 一 种 四 元 数 的 插值 方法 是 以 最 
小 的 旋转 角度 高 效 地 完成 旋转 操作 (类 似 于 图 22.9a 所 示 的 情形 ) ， 另 一 
种 则 需要 绕 很 远 的 一 段 距离 才能 完成 任务 与 图 22.9b 中 的 情况 相 
似 ) 。 现 在 我 们 再 来 看 图 22.10， 我 们 希望 根据 略 过 较 小 弧度 在 4D 单 位 
球面 上 插值 的 这 一 标准 ， 在 四 元 数 b 与 -b 两 者 之 间 进 行 选择 。 如 果 选 择 
了 较 小 弧度 的 旋转 方式 ， 那 么 将 采取 最 短 、 最 直接 的 路 径 进行 插值 ， 如 
果 选 择 了 较 大 弧度 的 旋转 方式 ， 则 会 使 物体 多 走出 不 少 的 冤枉 路 
[Eberly01]， 毕 竟 它 旋转 的 路 径 太 长 了 。 


























图 22.10 ”从 a 到 b 进 行 插值 即 为 按 较 大 弧度 所 在 4D 单 位 球面 上 插值 ， 反 之 ， 从 a 到 一 b 进 行 插值 
则 为 按 较 小 弧度 2 在 4D 单 位 球面 上 插值 。 当 然 ， 我 们 总 是 希望 按 最 小 的 弧度 ， 以 最 短 、 最 直接 
的 路 径 在 4D 单 位 球面 上 插值 





























根据 [Watt92]， 要 找到 表示 按 最 小 弧度 在 4D 单 位 球面 上 旋转 的 四 元 
数 ， 我 们 就 要 对 |a 一 61 与 |a 一 (-) = a+ 如 "进行 比较 。 如 果 
la +0 <lla 一 可 那么 就 选择 以 _p 来 代 蔡 5 进行 插值 ， 因 为 这 时 -更 
接近 于 a， 这 样 会 使 旋转 的 弧度 更 小 ， 经 过 的 路 径 〈 弧 长 ) 更 短 。 








// 线性 插值 “针对 theta 较 小 的 情况 ) 


public static Quaternion LerpAndNormalize(Quaternion p, Quaternion q, floa 


t s) 

{ 
// 对 结果 进行 规范 化 处 理 以 使 其 成 为 单位 四 元 数 
return Normalize((1.6f - s)*p + s*q); 


} 


public static Quaternion Slerp(Quaternion p, Quaternion q, float s) 


{ 
// 前 面 曾 讲 到 四 元 数 q 与 -q 表 示 着 相同 的 方向 ， 但 是 这 两 者 的 插值 过 程 却 不 相同 : 一 种 要 


略 过 最 小 的 弧 ， 
// 男 一 种 将 绕 过 较 大 的 弧 长 。 而 为 了 找到 最 小 的 弧 长 ， 就 要 对 p-q 的 模 与 p-(-q) = p+q 


的 模 进 行 比 较 
































if(Lengthsq(p-q) > LengthSsq(p+q) ) 
q = -q; 


float cosPhi = DotP(p, 9q); 








// 对 于 角度 极 小 的 情况 ， 采 用 线性 插值 
if(cosPhi > (1.6f - 0.061)) 
return LerpAndNormalize(p, q, s); 




















// 求 出 两 个 四 元 数 之 间 的 夹 角 
float phi = (float)Math.Acos(cosPhi); 








float sinphi = (float)Math.Sin(phi); 














// 沿 着 p，q 与 单位 球 原点 所 在 平面 与 4D 单 位 球面 的 交点 所 























图 成 的 弧 进行 插值 


return ((float)Math.Sin(phi*(1.60-s))/sinphi)*p + 
((float)Math.Sin(phi*s)/sinphi)*q; 





22.5 DirectX 效 学 库 中 与 四 元 效 有 关 的 函数 


DirectX 数 学 库 支 持 四 元 数 的 相关 运算 。 由 于 四 元 数 的 “数据 ?是 4 个 
实数 ， 所 以 DirectX 数 学 库 以 XMVECTOR 类 型 来 存储 四 元 数 。 以 下 是 该 库 
中 一 些 常 用 的 四 元 数 函 数 定义 。 








// 返回 四 元 数 点 积 Q] : Q@> 
XMVECTOR XMQUaternionDot (XMVECTOR Q1, XMVECTOR Q2); 





// 返回 四 元 数 单位 元 (6，86，8，1) 
XMVECTOR XMQUuaternionIdentity(); 


// 返回 四 元 数 Q 的 共 斩 四 元 数 
XMVECTOR XMQUaternionCojugate(XMVECTOR Q) 





// 返回 四 元 数 Q@ 的 范 数 〈 模 ) 
XMVECTOR XMQuaternionLength(XMVECTOR Q); 











// 把 四 元 数 @ 作 为 一 个 4D 向 量 进行 规范 化 处 理 
XMVECTOR XMQUuaternionNormalize(XMVECTOR Q) ; 


// 计算 四 元 数 的 乘积 Q1Q@> 
XMVECTOR XMQUaternionMultiply(XMVECTOR Q1, XMVECTOR Q2); 


























// 根据 旋转 轴 及 旋转 角 表 示 法 来 计算 相应 的 四 元 数 
XMVECTOR XMQuaternionRotationAxis(XMVECTOR Axis, FLOAT Angle); 





























// 根据 旋转 ## 
该 方法 的 执行 

// 速 应 快 于 XMQuaternionRotationAxis 方 法 

XMVECTOR XMQUaternionRotationNormal (XMVECTOR NormalAxis,FLOAT Angle); 








与 旋转 角 表 示 法 来 计算 对 应 的 四 元 数 ， 这 里 的 旋转 轴 是 一 个 规范 化 向 量 一 因此 























// 根据 给 定 的 旋转 矩阵 来 计算 相应 的 四 元 数 
XMVECTOR XMQuaternionRotationMatrix(XMMATRIX M); 














// 根据 给 定 的 单位 四 元 数 来 构建 对 应 的 旋转 和 矩阵 [5] 
XMMATRIX XMMatrixRotationQuaternion(XMVECTOR Quaternion); 














// 从 四 元 数 Q 中 提取 旋转 轴 以 及 关于 此 轴 的 旋转 角 
VOID XMQuaternionToAxisAngle(XMVECTOR *pAxis, FLOAT *pAngle, XMVECTOR Q); 

















// 返回 slerp(Q1，Q，![{ft}](http://private.codecogs.com/gif.latex?{t}) ) 的 计 
算 结 果 ， 输 入 的 两 个 四 元 数 必 为 单位 四 元 数 























XMVECTOR XMQUaternionSlerp(XMVECTOR Q6，XMVECTOR Q1, FLOAT t); 





22.6 ”旋转 演示 程序 


在 本 章 的 演示 程序 中 ， 我 们 要 使 一 个 髓 骨头 网 格 围绕 简易 的 场景 移 
动 。 在 整个 过 程 中 ， 此 网 格 的 位 置 、 朝 向 以 及 大 小 部 是 时 刻 变 化 着 的 。 
我 们 通过 四 元 数 来 表示 髓 骨 尖 的 加 癌 ， 运 用 四 元 数 球面 插值 函数 slerp 在 
方向 之 间 进 行 插值 ， 并 以 线性 插值 对 网 格 的 位 置 与 大 小 插值 。 此 例 程 也 
为 第 23 章 的 主题 “角色 动画 ”起 到 “ 预 热 ”* 的 效果 。 





关键 帧 动画 (key frame animation) 是 一 种 常见 动画 的 形式 。 
关键 时 (key frame) 指定 了 物体 在 某 一 时 刻 的 位 置 、 绷 同 以 及 大 小 。 本 
章 示 例 〈 位 于 AnimationHelper.h/.cpp 文 件 内 ) 中 定义 了 下 列 关 键 帧 结构 
体 。 


struct Keyframe 


Keyframe(); 
~Keyframe(); 


float TimePos ; 
XMFLOAT3 Trans1lation; 
XMFLOAT3 Scale 
XMFLOAT4 RotationQuat ; 





动画 《animation) 即 为 按时 间 排 序 的 一 系列 关键 帧 。 





struct BoneAnimation 

{ 
float GetStartTime()const; 
float GetEndTime()const; 


void Interpolate(float t, XMFLOAT4X4& M)const; 


std: :Vector<Keyframe> Keyframes ; 


}; 





“bone” 这 个 名 字 的 由 来 将 在 下 一 市 中 揭晓 。 现 在 我 们 只 需 知 道 驱动 
一 个 单独 的 “bone” 就 如 同 驱 动 一 个 单独 的 物体 。GetStartTime 方 法 仪 
返回 第 一 个 关键 帧 的 起 始 时 间 点 。 比 如 说 ， 一 个 物体 可 能 在 时 间 轴 的 前 
10 秒 内 都 不 会 动 ， 这 时 ， 此 函数 便 派 上 了 用 场 。 类 似 地 ，GetEndTime 
方法 返回 的 则 是 最 后 一 个 关键 帧 的 结束 时 间 点 ， 这 便于 我 们 了 解 动画 的 
结尾 来 停止 驱动 “bone”。 








我 们 现在 已 经 有 了 一 系列 的 关键 帧 ， 它 们 定义 了 一 部 看 起 来 有 些 粗 
糙 的 动画 。 但 是 ， 关 键 帧 之 间 的 帧 义 该 怎样 来 实现 呢 ? 这 又 该 轮 到 插值 
计算 大 显 神威 了 。 针 对 两 个 关键 帧 下 与 人 +#1! 之 间 的 不 同时 刻 # 我 们 在 这 
两 个 关键 帧 之 间 对 此 进行 插值 。 





void BoneAnimation: :Interpolate(float 七 ，XMFLOAT4X4& M)const 


{ 
// 由 于 t 是 动画 开始 前 的 时 刻 ， 所 以 仅 返 回 第 一 个 关键 帧 
if( t <= Keyframes.front().TimePos ) 





























XMVECTOR S = XMLoadFloat3(&Keyframes.front().Scale); 
XMVECTOR P = XMLoadFloat3(&Keyframes.front().Translation); 
XMVECTOR Q = XMLoadFloat4(&Keyframes.front().RotationQuat); 


XMVECTOR zero = XMVectorSet(6.6f, 686.6f, 60.6f, 1.6f); 
XMStoreFloat4x4(8&M, XMMatrixAffineTransformation(S, zero, Q, P)); 

















} 

// 由 于 t 是 动画 结束 后 的 时 刻 ， 因 此 仪 返回 最 后 一 个 关键 帧 
else if( t >= Keyframes.back().TimePos ) 

{ 

XMVECTOR S = XMLoadFloat3(&Keyframes.back().Scale); 
XMVECTOR P = XMLoadFloat3(&Keyframes.back().Translation); 
XMVECTOR Q = XMLoadFloat4(&Keyframes.back().RotationQuat); 














XMVECTOR zero = XMVectorSet(6.6f, 8.6f, 60.6f, 1.6f); 
XMStoreFloat4x4(&M, XMMatrixAffineTransformation(S, zero, Q, P)); 











} 
// t 位 于 两 个 关键 帧 之 间 ， 所 以 对 此 进行 插值 
else 


{ 


for(UINT i = 6; i < Keyframes.size()-1; ++i) 


{ 














if( 七 >= Keyframes[i].TimePos && t <= Keyframes[i+1].TimePos ) 

{ 

float lerpPercent = (t - Keyframes[i].Timepos) / 
(Keyframes[i+1].TimePos - Keyframes[i].TimePos); 


XMVECTOR s@ = XMLoadFloat3(&Keyframes[i].Scale); 
XMVECTOR s1 = XMLoadFloat3(&Keyframes[i+1].Scale); 


XMVECTOR pO = XMLoadFloat3(&Keyframes[i].Translation); 
XMVECTOR p1 = XMLoadFloat3(&Keyframes[i+1].Translation); 


XMVECTOR q8 = XMLoadFloat4(&Keyframes[i].RotationQuat); 
XMVECTOR q1 = XMLoadFloat4(&Keyframes[i+1].RotationQuat); 


XMVECTOR S = XMVectorLerp(s@, s1, lerpPercent); 
XMVECTOR P = XMVectorLerp(pe, pl1l, lerpPercent); 
XMVECTOR Q = XMQuaternionSlerp(q0, ql1, lerpPercent); 


XMVECTOR zero = XMVectorSet(6.6f, 868.6f, 60.6f, 1.6f); 
XMStoreFloat4x4(&M, XMMatrixAffineTransformation(S, zero, Q, P)); 


break; 





图 22.11 展 示 了 在 关键 帧 1 与 关键 帧 2 之 间 进 行 插值 所 生成 的 中 间 帧 


(in-between frame) 。 





图 22.11 关键 帧 插值 计算 的 示意 图 。 关 键 帧 定义 了 动画 中 的 “关键 "姿态 ， 
而 关键 帧 之 间 的 插值 则 表示 其 间 的 中 间 帧 


图 22.11 曾 用 于 Frank D. Luna 的 图 书 ，Introduction to 3D Game 
Programming with DirectX 9.0c: A _ Shader Approach, 2006: Jones and 





Bartlett Learning, Burlington, MA. www.jblearning.com， 现 经 许可 摘录 对 
js 


插值 完成 之 后 ， 我 们 还 要 在 着 色 器 程序 中 利用 和 矩阵 对 其 进行 变换 ， 
所 以 还 需 构建 对 应 的 变换 矩阵 。 这 里 所 用 的 
XMMatrixAffineTransformation 函 数 声 明 如 下 。 
XMMATRIX XMMatrixAffineTransformation( 


XMVECTOR Scaling, 
XMVECTOR Rotationorigin， 


XMVECTOR RotationQuaternion， 
XMVECTOR Translation); 
至 此 ， 简 易 动 画 系 统 已 经 准备 就 绕 。 接 下 来 的 工作 就 是 定义 一 些 关 
键 帧 。 











// App 类 中 的 成 员 数 据 





float mAnimTimePos = 0.6f; 
BoneAnimation mSkullAnimation; 
// 
// In constructor,define the animation keyframes 
// 
void QuatApp: :DefineSkullAnimation() 
{ 
// 3 i 
// 定义 动画 的 关键 帧 
// 


XMVECTOR q68 = XMQuaternionRotationAxis( 

XMVectorSet(6.6f, 1.6f, 60.6f, 0.6f), XMConvertToRadians(308.06f)); 
XMVECTOR q1 = XMQuaternionRotationAxis( 

XMVectorSet(1.6f, 1.6f, 2.6f, 6.6f), XMConvertToRadians(45.06f)); 
XMVECTOR q2 = XMQuaternionRotationAxis( 

XMVectorSet(6.6f, 1.6f, 6.6f, 8.6f), XMConvertToRadians(-308.06f)); 
XMVECTOR q3 = XMQuaternionRotationAxis( 

XMVectorSet(1.6f, 86.6f, 60.6f, 0.6f), XMConvertToRadians(708.06f)); 


mSkullAnimation.Keyframes.resize(5); 

mSkullAnimation.Keyframes[8].TimePos = 6.6f; 

mSkullAnimation.Keyframes[8].Translation = XMFLOAT3(-7.6f，6.6f， 
8.6f); 

mSkullAnimation.Keyframes[8].Scale = XMFLOAT3(6.25f，6.25f，6.25f); 

XMStoreFloat4(&mSkullAnimation.Keyframes[8].RotationQuat, q0); 


mSkullAnimation.Keyframes[1].TimePos = 2.6f; 

mSkullAnimation.Keyframes[1].Translation = XMFLOAT3(6.6f，2.6f， 
10.6f); 

mSkullAnimation.Keyframes[1].Scale = XMFLOAT3(6.5f, 8.5f, 06.5f); 

XMStoreFloat4(&mSkullAnimation.Keyframes[1].RotationQuat, q1); 


mSkullAnimation.Keyframes[2].TimePos = 4.6f; 

mSkullAnimation.Keyframes[2].Translation = XMFLOAT3(7.6f，6.6f， 
8.6f); 

mSkullAnimation.Keyframes[2].Scale = XMFLOAT3(6.25f，6.25f，6.25f); 


XMStoreFloat4(&mSkullAnimation.Keyframes[2].RotationQuat, q2); 


mSkullAnimation.Keyframes[3].TimePos = 6.6f; 

mSkullAnimation.Keyframes[3].Translation = XMFLOAT3(6.6f，1.6f， 
-10.6f); 

mSkullAnimation.Keyframes[3].Scale = XMFLOAT3(6.5f, 8.5f, 0.5f); 

XMStoreFloat4(&mSkullAnimation.Keyframes[3].RotationQuat, q3); 


mSkullAnimation.Keyframes[4].TimePos = 8.6f; 

mSkullAnimation.Keyframes[4].Translation = XMFLOAT3(-7.6f, 6.6f, 
8.6f); 

mSkullAnimation.Keyframes[4].Scale = XMFLOAT3(6.25f，6.25f，6.25f); 

XMStoreFloat4(&mSkullAnimation.Keyframes[4].RotationQuat, q0); 








每 一 个 关键 帧 中 都 将 改变 髓 途 尖 的 大 小 ， 并 将 它 以 不 同 朝 向 安置 在 
场景 中 的 不 同位 置 。 如 果 读 者 有 兴趣 ， 可 以 答 试 为 此 演示 程序 添加 目 己 
所 构思 的 关键 帧 或 修改 关键 帧 数据 。 例 如 ， 读 者 可 以 把 所 有 帧 的 旋转 与 
缩放 变换 都 设 为 恒 等 变换 〈identity， 也 就 是 变换 后 却 保持 原 有 状态 ) ， 
以 此 来 观看 只 有 物体 位 置 发 生变 化 的 动画 效果 。 








最 后 一 个 步骤 是 随 着 时 间 的 改变 ， 通 过 对 当前 的 髓 骨 头 世界 矩阵 进 
行 插值 来 确定 此 帧 的 动画 数据 。 





void QuatApp: :UpdateScene(float dt) 


{ 








// 使 时 间 的 车 轮 向 前 滚动 〈 推 进 时 间 点 在 时 间 轴 上 的 位 置 ) 
mAnimTimePos += dt; 
if(mAnimTimePos >= mSkullAnimation.GetEndTime()) 






































{ 
// 将 动画 环 回 至 起 始 时 间 
mAnimTimePos = 0.6f; 


} 


// 求 出 此 刻 的 髓 贬 头 世界 矩阵 
mSkullAnimation.Interpolate(mAnimTimePos, mSkullWorld); 











中 


为 了 使 船 仍 头 “ 摇 头 晃 脑 ”， 令 它 的 世界 矩阵 在 每 一 帧 都 有 所 变化 ， 
如 图 22.12 所 示 。 





国 Quatemion Demo FPS:1208 Frame Time: 0.827815 (ms) 














图 22.12 ”四 元 数 演示 程序 的 效果 


027 站 全 


et 
数 ， 它 通常 被 简 记 为 9 = Wu ui) = (7,y,z,ww)， 我 们 称 w = (7,y, 3 为 向 量 虚 
部 ，w 为 实 部 。 而 且 ， 我 们 将 四 元 数 的 相等 以 及 加 、 减 、 乘 三 则 运算 分 
别 定 义 如 下 : 





(a) (u, oj = (v, b), 当日 仪 当 w = vHla = bb。 
(by (lu, g 士 (ID, 人 一 ( 土 D,Q 士 。 


(Cc) (uajlu, b)= (av+t+hutux wv, ab uv), 


2. 四 元 数 之 间 的 乘法 运算 不 满足 交换 律 ， 但 是 满足 结合 律 。 可 将 
四 元 数 e = (0,0,0, 1 看 作 乘法 单位 元 。 四 元 数 乘法 对 加 法 的 分 配 律 为 


Plg+7)= pq+priRlq+T)p= gp+rp, 


3. 我 们 可 以 通过 把 实数 写作 s = (0,0,0,5s) 来 将 其 转换 到 四 元 数 空 
间 ， 并 以 4 = (w,0) 的 表示 方法 将 向 量 u 转 换 至 四 元 数 空间 。 一 个 实 部 为 0 
的 四 元 数 称 为 纯 四 元 数 〈(pure quaternion) 。 标 量 与 四 元 数 的 乘法 为 
s(p1, p2, p3, pP4) = (sp1, sp2, sp3; sp4) = (p1,P2;P3,P4)s。 因此， 四 元 数 与 标量 
乘法 是 四 元 数 乘法 运算 中 满足 交换 律 的 一 种 特殊 情况 。 


4. 四 元 数 g = (q1;42;43;44) = (ud4) 的 共 恩 四 元 数 记 作 g*， 它 的 定义 
为 gf 二 抽 一 和 一 各 十 组 二 (一 ,44)。 四 元 数 的 范 数 Cnorm。 或 称 模 ， 即 








、、、 ei p= Me 2 十 0 十 02 一 / 2 
magnitude) 定义 为 | 中 = Va = V+@+8+q4 二 Vull 十 下。 如 果 
一 个 四 元 数 的 范 数 为 1， 那 么 称 之 为 日 位 四 元 数 (unit quaternion) 。 
5. 设 9 = (41,42,43;,44) = (4, 44) 为 一 个 非 零 四 元 数 ， 那 么 ， 它 的 道 记 


1 d+* 


作 g-1， 且 定义 为 ” ”更 。 如 果 g 是 一 个 单位 四 元 数 ， 那 么 go- = q*。 


6. 可 以 把 一 个 单位 四 元 数 9 = (w,44) 写 作 极 坐标 的 表示 形式 (polar 
representation) 4 = (sin9n,cos9)， 其 中 的 n 为 一 个 单位 向 量 。 


7. 如 果 g 为 一 个 单位 四 元 数 ， 那 么 当 |m|| = 1 且 9 s [0,7 时 ， 则 有 
q = (sin 69n,cos9)。 四 元 数 旋 转 算 子 的 定义 为 fa(?) = qug ”= qvq*， 它 表 
示 点 或 向 量 v 绕 轴 m 按 角 28 进 行 旋转 。 镶 有 相应 的 矩阵 表示 法 ， 而 且 任何 


的 旋转 矩阵 都 能 被 转换 为 一 个 表示 其 对 应 旋转 操作 的 四 元 数 。 








8. 对 于 动画 方面 而 言 ， 在 两 个 方 同 之 间 进 行 插值 是 一 项 很 常见 的 
工作 。 把 每 个 方 辐 都 用 一 个 单位 四 元 数 表示 ， 我 们 就 能 通过 对 这 些 单位 
四 元 数 进 行 球面 插值 来 求 取 相应 的 插值 方向 。 


22.8 ”练习 


1. 计算 下 列 复 数 算式 。 


(a) | + (—1+2) 
(b) ! = 直击 
(c) | = 

(d) 4(—1+2) 

Ce) ! ) 作 一 上 十 2 


(f) = = (3+ 20)， 计 算 z 的 共 辆 复数 过 
Cg) 3+ 2 
2. 把 复数 (-1, 3) 写作 极 坐标 的 形式 。 


3. 通过 复数 的 乘法 运算 使 向 量 (2, 1) 旋 转 30°。 


a++ib 


4. 根据 复数 除法 的 定义 来 证 明 : pr 
5. 设 z 二 a 十 1b。 证 明 |z| = ZZ, 


6. 设 M 为 一 个 2 x 2 和 矩阵。 证 明 : detM =1 昌 M-! = MT， 当 日 仪 


cos@ sin 
当 ”|L-sin6 cos9]。 即 ， 当 目 仅 当 M 是 一 个 旋转 箱 阵 。 这 给 验证 茶 
和 矩阵 是 否 为 旋转 矩阵 提供 了 一 条 途径 。 


"| 








7. 设 P= (1,2,3, 和 有 gq = (2, 一 1,1, 一 2) 都 为 四 元 数 。 计 算 下 列 各 式 。 
(a) P+g 
(b) Pp—gq 
(Cc) pg 
(d) Pp* 
Ce) qa* 
(f) Pp*Pp 
Cg) lIp|| 
Ch) lal| 
(Ci p 
区 


本 | 
2 


一 、 一 .日 、 
8， 将 单位 四 元 数 ” ( 上 





3 1 
| Wt 


3 
村 2 2 三 
9. 把 单位 四 元 数 
10. 求 出 令 向 量 (或 点 ) 绕 轴 (1,1, 1 旋转 45° 的 单位 四 元 数 。 


11. 求 出 令 向 量 (或 点 ) 绕 轴 (0, 0, 一 1 旋转 60° 的 单位 四 元 数 。 


12. 设 : i 皆 为 单位 四 元 数 。 计 算 
] 
em (0 ee 结果 也 为 一 个 单位 四 元 数 。 
13. 证 明 可 以 将 四 元 数 (z,y, >, 世 ) 写 作 zi 二 好 十 zk 二 w 的 形式 。 
14. 证 明 44* = 4*4 = 红 十 他 十 阴 十 村 = ul + q1, 


15. 设 P 二 (w,0) 与 9 = (v,0) 为 纯 四 元 数 〈 即 实 部 为 0，。 证 明 


pq = (pxXgqg,—p:q), 
16. 证 明 下 列 性 质 。 
(a) (Pq)* = q+* p+* 
(b) (P+ q)*= Dp*+q* 
(c) 当 s € RR 时 ，(sq*)* 一 sq* 
(d) ggy =q*q=q+q@+g+q 


(Ce) llpall = llpll lial 


sin((1 ~— tO)a+sin(to)b 


17. 用 代数 方法 证 明 : ” sn 








= cos(t0) 


18. 设 a、b、c 部 为 3D 同 量 。 证 明 下 述 恒等式 : 
(a) axlbxc)=(la:cb—(a:be 


(b) (a xb)xc=—(c:bjati+l(c:a)b 


[本 章 中 ， 作 者 在 四 元 数 的 表示 方法 上 似乎 有 点 不 按 套路 出 牌 ， 即 与 
第 见 的 文献 稍 有 差异 ， 但 原理 和 计算 方法 是 一 致 的 。 看 起 来 ， 作 者 希望 
用 算 阵 、 回 量 、 三 角 函 数 与 类 比 法 来 讲解 ， 这 样 会 统 过 数学 上 烦琐 的 形 
式 化 证 明 ， 更 易 理解 。 另 外 ， 有 些 地 方 的 跨度 可 能 比较 大 ， 读 者 可 参考 
一 些 其 他 的 资料 来 加 以 补充 《基本 上 回 看 开篇 的 癌 量 与 定 阵 知识 即 
可 ) ， 这 也 就 是 作者 要 在 开篇 回 读 者 推荐 专业 书籍 的 原因 吧 ， 本 书 里 的 
四 元 数 充 其 量 只 是 一 种 工具 而 已 。 上 文 推荐 的 那 本 书 的 作者 有 篇 论文 名 
为 《quaternions and rotation sequences》 〈 即 “四 元 数 及 其 旋转 序列 ?”， 与 
原 书 同名 ) ， 可 用 作 原 书 的 基本 概述 并 作为 补充 材料 。 另 有 维基 百科 可 
参考 查阅 。 





[2] 由 于 虚 部 是 向 量 ， 所 以 此 处 直接 看 作 疝 量 义 积 运 算 即 可 ， 下 同 。 





[3] 推导 过 程 中 还 运用 了 了 叉 积 的 反 交 换 律 4a x b = 一 bx a 与 点 积 的 交换 律 


a:b=b:ao 


[4] 事实 上 ， 这 种 插值 方式 通常 被 称 为 球面 线性 插值 ， 即 spherical 
linear interpolation， 缩 写 为 slerp。 


[5] 官方 注释 是 “根据 一 个 四 元 数 来 构建 旋转 矩阵 ”。 
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注 意 Note a 


本 章 的 部 分 内 容 曾 出 现在 Frank D. Luna 的 著作 Introduction to 3D 
Game Programming with DirectX 9.0c: A Shader Approach, 2006: Jones and 





Bartlett Learning, Burlington, MA， 现 经 许可 摘录 。 


在 本 章 中 ， 我 们 将 学 习 如 何 驱 使 人 类 或 动物 这 些 复杂 的 动画 角色 运 
动 起 来 。 所 谓 复杂 ， 是 因为 需要 在 同一 时 刻 令 其 中 的 许多 可 运动 部 分 活 
动 起 来 。 回 忆 一 下 我 们 跑步 的 动作 就 会 发 现 一 一 每 块 骨骼 (bone， 是 不 
是 有 点 眼熟 ? ) 都 要 按 各 自 的 轨迹 运动 。 不 借助 任何 工具 赤 手 空 拳 地 创 
建 这 样 复杂 的 动画 是 不 切实 际 的 ， 因 此 ， 要 完成 这 项 任务 往往 需要 运用 
特定 的 模型 与 动画 制作 工具 。 假 设 现 在 已 经 拥有 了 角色 及 其 相应 的 动画 
数据 ， 让 我 们 马上 开始 本 章 中 用 Direct3D 令 角色 活灵活现 以 及 用 泻 染 动 
画 的 旅程 吧 。 











学 习 目 标 : 


1. 熟悉 与 动态 脓 皮 网 格 相关 的 专业 术语 。 


2. 学 习 网 格 层 次 变换 的 数学 描述 ， 并 对 基于 树 型 的 网 格 层次 绩 构 
进行 过 历 。 


3. 理解 项 点 混合 技术 的 主体 思想 及 其 数学 表示 。 


4. 了 解 如 何 从 文件 中 加 载 动画 数据 。 


5. 探索 如 何 用 Direct3D 来 实现 角色 动画 。 


23.1 框架 层次 革 


许多 物体 是 由 保持 “父子 ”关系 的 多 个 部 分 组 成 的 ， 其 中 ， 存 在 一 个 
机 E 够 按照 它们 自己 的 轨迹 独立 地 运动 (可 能 
受到 物理 运动 上 的 限制 一 一 比如 ， 人 类 的 关节 部 分 只 能 在 特定 的 范 
6 。 但 是 ， 当 父 对 象 运动 时 ， 其 子 对 象 也 将 被 迫 随 之 移动 。 举 
个 例子 ， 思 考 一 下 ， 上 胶 可 上 自然 地 分 为 上 臂 、 前 臂 与 手 这 3 个 部 分 。 手 
可 以 绕 着 脐 关 市 独立 于 辟 转 动 。 但 是 ， 如 果 前 辟 绕 着 肘 关 转动 ， 则 手 
也 必 随 之 转动 。 类 似 地 ， 如 果 上 和 臂 绕 着 屑 关节 转动 ， 那 么 前 臂 必 随 之 转 
动 ， 又 由 于 前 臂 被 带动 ， 因 而 手 亦 随 之 运动 〈 见 图 23.1) 。 这 样 一 来 ， 
EN 象 层次 结构 (object hierarchy) 关系 : 手 是 
前 辟 的 子 对 象 ， 前 臂 又 是 上 辟 的 子 对 象 。 如 果 再 将 此 实例 进行 扩展 ， 那 
pi es 右 以 此 类 推 ， 那 么 将 得 到 一 副 完 整 的 骨 
骼 系统 “图 23.2 展 示 了 一 种 更 为 复杂 的 层次 示例 ) 。 


AN 


图 23.1 层次 变换 (hierarchy transform ) 。 可 以 观察 到 一 块 骨骼 的 父 对 象 的 变换 会 对 它 自己 及 
其 子 对 象 造成 影响 
















































图 23.2 一 种 模拟 具有 无 毛 两 足 动物 基本 根性 角色 的 更 为 复杂 的 树 状 层次 结构 。“ 父 对 象 ”以 向 
下 的 箭头 指向 它 的 “第 一 个 子 对 象 "， 右 向 箭头 则 表示 两 对 象 之 间 的 “兄弟 "关系 。 例 如 ，*“ 左 大 
腿 “ 右 大 腿 "与 “下 次 椎 "都 为“ 盆 骨 "骨骼 的 子 对 象 























本 节 的 目标 是 展示 如 何 根据 一 个 对 象 及 其 依 先 (ancestor， 即 它 的 
父 对 象 、 祖 父 对 象 以 及 曾祖 父 对 象 等 ) 对 象 的 位 置 ， 将 其 正确 地 定位 于 
场景 之 中 。 


数学 描述 


注 意 Note Wo 


在 学 习 本 小 市 之 前 ， 读 者 不 妨 先 回 顾 本 书 的 第 3 章 ， 特 别 是 其 中 的 
坐标 变换 部 分 。 





为 了 保证 讲解 过 程 简 单 而 又 具体 ， 我 们 采用 上 和 臂 《〈 根 对 象 ) 、 前 尽 





与 手 这 一 层次 关系 作为 示例 。 在 此 ， 我 们 分 别 把 它们 标记 为 骨骼 0、 骨 
骼 1 以 及 骨骼 2 〈 见 图 23.3) 。 


[F 辟 Cm) | 前 辟 Mi 





图 23.3 ”一 个 简单 的 上 胶 层 次 结构 图 


只 要 理解 了 基本 的 概念 ， 我 们 就 可 以 把 它 直 接 推广 到 处 理 更 为 复杂 
的 情景 之 中 。 当 前 的 问题 是 ， 如 果 给 定 了 茶 层 次 结构 中 的 特定 对 象 ， 如 
何 把 它 正 确 地 变换 到 世界 空间 中 呢 ? 显而易见 的 是 ， 我 们 无 法 将 该 对 象 
直接 变换 至 世界 空间 ， 这 是 因为 它 在 场景 中 的 位 置 也 受到 其 祖先 对 象 的 
影响 ， 所 以 我 们 还 必须 顾及 那些 祖 移 对 象 的 变换 。 




















层次 结构 中 的 每 个 对 象 都 相对 于 其 旋转 所 依赖 的 枢纽 天 市 (pivot 
joint) 为 原点 的 局 部 坐标 系 进行 建 模 〈 见 图 23.4) 。 








图 23.4 每 块 骨骼 几何 体 都 是 相对 于 其 自身 的 局 部 坐标 系 来 描述 的 。 但 是 ， 由 于 所 有 的 坐标 系 
都 位 于 同一 个 世界 空间 之 中 ， 上 所 以 我 们 就 能 够 得 到 它们 之 间 任 意 一 对 的 联系 











由 于 所 有 对 象 的 坐标 系 都 位 于 同一 世界 空间 之 中 ， 所 以 我 们 就 能 基 


于 这 一 点 将 它们 联系 起 来 ， 特 别 是 我 们 能 够 描述 出 : 在 任意 时 刻 ， 每 个 
对 象 坐标 系 与 其 父 对 象 坐标 系 呈 的 位 置 关 系 〈 这 里 研究 的 是 固定 时 刻 的 
物体 快照 ， 这 是 因为 在 一 般 情况 下 这 些 网 格 的 各 个 层次 都 是 相对 活动 

的 ， 而 且 它 们 的 关系 会 随 着 一 个 特定 的 时 间 函 数 而 发 生 改变 ) 。( 根 对 
象 标 架 ，root frame， 也 有 译作 根 框架 ， 继 而 有 框架 位 、 框 架 记 等 ) fo0 的 
父 华 标 系 为 世界 空间 坐标 系 W， 即 化 标 系 fo 是 相对 于 世界 空间 坐标 来 进 
行 描述 的 。〉 笃 握 了 父子 坐标 系 之 间 的 关系 后 ， 我 们 束 可 以 用 变换 和 矩阵 
将 坐标 由 子 (对象) 空间 变换 至 其 父 对象) 空间 (此 思路 与 局 部 空间 
至 世界 空间 的 变换 相 一致 ， 区 别 仅 为 这 里 执行 的 是 局 部 空间 疝 其 父 空间 
的 变换 ) 。 设 4 为 将 几何 体 从 标 架 让 变换 至 站 的 矩阵 ， 和 41 为 将 几何 体 从 
标 架 所 变换 至 fo 的 算 阵 ，A0 为 将 几何 体 从 标 染 fo 变换 至 WW 的 矩阵 。 (我 
们 称 A; 为 至 父 侍 标 系 和 矩阵 〈to-parent) ， 利 用 它 可 以 将 几何 体 从 子 坐 标 
系 变换 至 其 父 坐标 系 。) 这 样 一 来 ， 我 们 就 能 通过 下 面 定义 的 和 矩阵 AM; 
将 上 肢 层 次 结构 中 的 第 ;个 对 象 变 换 至 世界 空间 : 














MM; = AiA; 1...AlAn (23.1) 


尤其 是 在 上 觅 实例 中 ， 利 用 矩阵 Ma = 42414o，M1 = 4140o 与 
M0 = 40 就 能 分 别 将 手 部 、 前 臂 与 上 臂 直接 变换 到 世界 空间 。 可 以 观察 
到 ， 每 一 个 对 象 都 继承 了 其 祖先 对 象 的 变换 操作 ， 这 也 就 满足 了 上 文 所 
提 到 的 如 果 上 项 移动 ， 那 么 手 部 也 随 之 运动 这 一 要 求 。 





图 23.5 用 几何 的 方式 详细 解释 了 式 〈23.1) 。 事 实 上 ， 要 对 上 有 歧 层 
次 结构 中 的 某 个 对 象 进行 变换 ， 只 需 依 次 应 用 该 对 象 及 其 各 祖先 的 “至 
父 坐 标 系 矩阵”， 使 之 按 其 祖先 对 象 升序 的 次 序 在 坐标 系 层次 中 上 滤 





(percolate upD) ， 直 到 此 对 象 变 换 至 世界 空间 为 止 。 


过 
一 、~、42 
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Ag = 五 
/ -” Ai40 / 
/ 了 2 
Y a 
W 
图 23.5 ”由 于 可 以 在 同一 个 世界 空间 中 描述 层次 结构 里 各 对 象 坐 标 系 的 关系 ， 所 以 我 们 能 够 将 
某 个 
对 象 变换 至 另 一 个 对 象 的 空间 中 。 特 别 是 在 上 肢 层 次 结构 这 个 示例 中 ， 我 们 就 是 以 骨骼 坐标 系 
及 其 
父 坐标 系 的 关系 建立 起 坐标 系 之 间 的 联系 。 据 此 就 能 构建 出 至 父 坐标 系 的 变换 矩阵 ， 以 此 将 骨 
骼 


全 | 


几何 体 从 它 的 局 部 空间 变换 至 其 父 坐 标 系 。 一 旦 该 对 象 位 于 其 父 坐 标 系 ， 我 们 就 能 通过 其 父 
对 象 的 “至 父 坐标 系 矩 阵 ?"， 再 将 此 对 象 变 换 至 其 祖父 坐标 系 之 中 ， 并 以 此 类 推 ， 
直到 此 对 象 过 历 每 个 祖先 对 象 的 坐标 系 ， 变 换 至 世界 空间 之 中 









































在 上 胶 层次 结构 这 个 示例 中 ， 我 们 采用 了 简单 的 线性 层次 结构 来 描 
述 其 中 对 象 的 关系 。 这 种 想法 也 可 以 推广 到 一 种 树 形 的 层次 结构 。 在 这 
种 结构 中 ， 将 对 象 变换 至 世界 空间 的 方式 变 为 了 依次 应 用 该 对 象 及 其 各 
祖先 〈 按 升序 顺序 ) 的 “人 至 父 坐标 系 和 矩阵? 使 之 在 层次 络 构 中 上 涯 ， 直 至 
目标 对 象 变换 至 世界 空间 为 止 ( 这 里 再 强调 一 次 ， 根 标 架 的 父 坐 标 系 即 
为 世界 空间 ) 。 这 唯一 的 实质 性 差别 即 我 们 用 更 为 复杂 的 树 形 结构 取代 
了 此 前 的 线性 链表 结构 。 











我 们 再 来 看 一 个 更 复杂 的 示例 ， 考 虑 图 23.2 所 示 的 角色 左 侧 锁 骨 。 





由 于 它 是 贷 骨 的 同 级 兄 第 对 象 ， 因 此 它 也 是 上 疹 椎 的 一 个 子 对 象 。 这 样 
一 来 ， 左 侧 锁 骨 的 世界 变换 是 经 过 左 侧 锁 骨 人 至 父 坐 标 系 的 变换 、 上 少 椎 
至 父 坐 标 系 的 变换 、 下 浓 椎 至 父 坐 标 系 的 变换 、 盆 骨 至 父 坐 标 系 的 变换 
来 实现 的 。 





23.2” 蒙 皮 网 格 
23.2.1 定义 


图 23.6 所 示 的 是 一 款 动画 角色 网 格 。 图 中 高 亮 标 出 的 骨骼 链 称 为 骨 
架 〈skeleton) ， 而 它 所 具有 的 性 质 使 它 为 驱动 一 款 角 色 动 画 系 统 的 工 
作 提 供 了 一 份 天 然 的 层次 结构 。 骨 架 补 外 表皮 (skin〉 附 着， 我 们 用 3D 
几何 图 形 ( 顶 点 与 多 边 形 〉 来 对 它 进行 模拟 ， 这 便 是 蒙 皮 操作 。 皮 肤 顶 
点 所 位 于 的 绑 定 空间 (bind space) 是 定义 整个 皮肤 时 所 参照 的 局 部 坐 
标 系 ( 通 党 是 根 坐 标 系 〉。 与 现实 中 的 情况 相同 ， 骨 架 中 的 每 一 块 骨 骼 
都 带动 着 与 它 关 联 的 局 部 皮肤 (在 此 ， 即 骨骼 所 带动 的 众 顶 点 ) 的 形状 
与 位 置 。 如 此 一 来 ， 随 着 驱动 骨 能 ， 其 附属 的 皮肤 也 会 根据 骨架 的 当前 
姿态 相应 地 进行 调整 。 











图 23.6 ”一 款 角色 网 格 。 高 亮 标 出 的 骨骼 链表 示 角 色 的 骨架 ， 黑 色 多 边 形 则 代表 人 物 的 皮肤 。 








定义 皮肤 顶点 所 用 的 绑 定 空间 (bind space) 是 在 对 整个 皮肤 网 格 建 模 时 所 参照 的 坐标 系 


23.2.2 ”重新 推导 将 骨骼 变换 全 根 坐 标 系 的 公 却 


我 们 在 本 节 中 将 推导 的 内 容 与 23.1 节 有 部 分 差别 。 第 一 点 区 别 是 : 
在 这 一 节 中 ， 我 们 要 把 将 对 象 从 根 坐标 系 变换 至 世界 坐标 系 作 为 一 个 单 
独 的 步骤 。 因 此， 本 节 所 求 的 并 非 是 前 文中 将 每 块 骨骼 对 象 变换 至 世界 
空间 的 矩阵 ， 而 是 要 找寻 把 每 块 骨骼 对 象 变换 至 根 坐 标 系 〈to-root， 即 
将 骨骼 对 象 从 其 局 部 坐标 系 转换 至 根 坐 标 系 所 需 的 变换 ) 的 矩阵 。 








第 二 点 不 同 之 处 在 于 ， 在 23.1 节 中 ， 我 们 是 以 自 底 向 上 的 方式 遍历 
目标 对 象 的 祖先 节点 ， 也 就 是 说 ， 以 一 块 骨骼 为 起 点 上 移 至 其 祖先 节 
点 。 但 是 ， 若 按 自 项 向 下 的 方式 进行 遍历 ， 即 以 根 节点 开始 向 树 状 结构 
的 下 端 移动 其 实效 率 更 高 (参见 式 (23.2) ) 。 用 整数 0,1,…,n 一 1 对 n 块 
骨骼 进行 标记 ， 我 们 就 能 以 下 列 公 式 来 表示 第 ; 块 骨骼 至 根 坐 标 系 的 变 
换 : 














toRoot; = toParent;: toRootp (23.2) 





其 中 ，P 为 骨骼 ;的 父 对 象 的 下 标 。 这 个 公式 究竟 是 什么 意思 呢 ? 事 
实 上 ，toRootp 给 出 的 是 将 几何 体 从 骨骼 P 的 坐标 系 直接 快递 至 根 坐标 系 
的 映射 。 所 以 ， 为 了 使 几何 体 变 换 至 根 坐 标 系 ， 我 们 仅 需 从 骨骼 ;的 坐 
标 系 中 获取 几何 体 ， 再 通过 toParent 将 几何 体 变换 至 骨骼 ; 父 对 象 2 的 坐 
标 系 即 可 。 











现在 整个 流程 中 存在 的 唯一 问题 就 是 ， 在 处 理 第 ; 英 骨 佣 的 时 候 ， 


我 们 必须 计算 其 父 对 象 至 根 坐 标 系 的 变换 〈toRootp ) 。 如 果 按 自 顶 回 
下 的 顺序 过 历 树 状 结构 ， 那 么 计算 父 对 象 “至 根 坐 标 系 变换 ”的 工作 就 总 
要 先 于 计算 其 子 对 象 的 “至 根 坐标 系 变换 ”。 














此 时 ,“ 自 顶 向 下 ?这 种 通 历 方法 便 凸 显 出 了 更 为 高 效 的 优势 。 知 采 
用 上 自 顶 癌 下 的 方式 进行 过 历 ， 对 于 任意 骨骼 ;来 讲 ， 我 们 事实 上 已经 提 
前 得 到 了 将 其 父 对 象 转换 至 根 坐标 系 的 变换 和 矩阵。 这样 一 来 ， 我 们 离 将 
骨骼 ;变换 到 根 坐 标 系 之 中 的 目标 只 有 一 步 之 运 。 而 采用 “ 自 底 向 上 ”的 
过 历 方法 时 ， 我 们 不 仅 要 为 每 块 骨骼 通 历 其 全 部 的 祖先 ， 而 且 要 在 不 同 
骨骼 分 享 共用 祖先 对 象 这 一 情况 下 ， 多 次 进行 重复 的 矩阵 乘法 。 











23.2.3” 仿 移 变 换 


事实 上 ， 角 色 皮 肤 的 定义 存在 着 一 条 微妙 的 细节 ， 那 就 是 受 骨 骼 带 
动 的 顶点 并 非 相 对 于 此 骨骼 的 坐标 系 而 定义 《它们 的 坐标 都 相对 于 绑 定 
宝 间 (bind space) ， 即 花 皮 网 格 建 模 所 用 的 坐标 系 ) 。 所 以 ， 在 运用 
式 〈23.2) 之 前 ， 我 们 首先 需要 将 各 皮肤 顶点 由 绑 定 空间 变换 至 牵动 它 
们 的 骨骼 的 空间 。 这 便 是 所 谓 的 偏 移 变换 (offset transformation ) ， 如 
图 23.7 所 示 。 











图 23.7 首先 通过 偏 移 变换 将 受 骨骼 带动 的 皮肤 项 点 从 绑 定 空间 变换 至 此 骨骼 的 空间 。 接 着 ， 
待 这 些 顶点 位 于 骨骼 空间 后 ， 就 应 用 骨骼 的 “至 根 坐 标 系 变换 ”将 它们 从 骨骼 空间 转换 到 根 空间 











之 中 。 最 终 变换 (final tranoformation) 即 是 把 偏 移 变换 与 “至 根 坐 标 系 变换 ” 按 顺 序 组 合 起 来 的 
变换 





如 此 一 来 ， 我 们 就 能 通过 任意 骨骼 巨 的 俩 移 官 阵 对 相关 皮肤 项 点 进 
行 变换 ， 将 这 些 顶 点 从 绑 定 空间 转换 至 骨骼 她 的 局 部 空间 。 只 要 相关 皮 
肤 项 点 位 于 骨骼 妃 的 局 部 空间 ， 我 们 就 能 利用 骨骼 妃 的 “至 根 坐标 变 
换 ”， 将 它们 转换 到 角色 空间 中 当前 动画 姿态 的 对 应 位 置 。 


我 们 现在 来 介绍 一 种 名 为 最 终 变 换 〈final transform) 的 变换 新 品 ， 
其 实 束 是 把 骨骼 的 偏 移 变换 及 其 “至 根 坐 标 系 变换 ”组 合 起 来 。 从 数学 上 
来 讲 ， 第 ; 块 骨 骼 的 最 终 变换 矩阵 瓦 的 定义 为 : 





了 下; = offset; :+ toRoot; (23.3) 


23.2.4 ”驱动 骨架 运动 





在 前 一 章 的 演示 程序 中 ， 我 们 展示 了 如 何 驱 使 一 个 单独 的 物体 运 
动 。 我 们 定义 了 关键 帆 (key frame) 来 指定 物体 在 某 一 时 刻 的 位 置 、 阳 
问 以 及 缩放 大 小 。 动 画 (animation) 则 为 一 系列 按时 间 先 后 顺序 排列 的 
关键 帧 ， 这 便 是 动画 的 粗略 定义 。 另 外 ， 我 们 还 省 示 了 如 何在 关键 帧 之 
间 进 行 插值 ， 以 计算 出 在 两 个 关键 帧 之 间 茶 些 时 刻 的 物体 方位 。 现 在 ， 
我 们 通过 扩展 之 前 的 动画 系统 来 驱动 多 块 骨 骼 运动 。 这 些 提 及 的 动画 类 
都 被 定义 在 本 章 例 程 <Skinned Mesh 〈 蒙 皮 网 格 ) ”中 的 
SkinnedData.h/.cpp 文 件 内 。 





使 一 副 骨 骼 运动 并 不 比 驱 动 一 个 单独 的 物体 复杂 多 少 。 其 实 ， 我 们 


完全 可 以 把 单独 的 物体 看 作 一 块 骨骼 ， 而 一 副 骨 架 就 是 一 组 连接 在 一 起 
的 骨骼 。 在 此 ， 我 们 假设 每 一 块 骨骼 都 能 相对 独立 地 运动 。 所 以 ， 要 驱 
动 一 副 骨 染 运 动 ， 我 们 先 要 令 每 块 骨骼 在 它 所 在 的 局 部 范围 内 合理 地 活 
动 。 当 每 一 块 骨骼 都 能 在 它 目 己 的 天 地 里 活动 之 后 ， 我 们 就 要 将 其 祖先 
对 象 的 运动 对 它 的 影响 考虑 在 内 ， 并 将 它 转换 至 根 空间 。 











我 们 定义 了 一 段 由 一 系列 动作 每 一 个 动作 都 需要 骨架 中 的 所 有 骨 
骼 参与 ) 组 成 的 动画 片段 (animation clip〉， 以 令 骨 架 为 一 种 动作 而 协 
同 工 作 。 比 如 , “行走 “ 跑 路 “攻击 “下 蹲 ” 以 及 “跳跃 ”都 可 以 当 作 动画 
片段 的 内 容 。 


///< 摘 要 你 好 > 
/// AnimationClip 的 动作 实例 可 以 上 目 . “行走 2“ 跑 动 2 攻击 2 下 昌 33 
/// 一 段 AnimationClip 需 要 利用 BoneAnimation 来 协调 每 块 骨骼 实现 动画 
///</ 搞 要 再 见 > 
struct AnimationClip 
{ 

// 该 动画 片段 里 所 有 骨骼 中 最 早 开 始 运动 的 起 始 时 间 

float GetClipStartTime()const; 

























































































// 此 动画 片段 里 所 有 骨骼 中 最 晚 停止 运动 的 结束 时 间 
float GetClipEndTime()const; 


// 遍历 该 动画 片段 中 的 每 个 BoneAnimation， 并 据 此 对 动画 进行 插值 
void Interpolate(float t, std::vector<XMFLOAT4X4>& boneTransforms)const; 








// 用 来 指挥 每 一 块 骨骼 运动 


std: :Vector<BoneAnimation> BoneAnimations ; 











为 了 使 应 用 程序 中 的 角色 表现 出 所 有 的 预定 动作 ， 我 们 往往 会 为 它 
制作 多 种 动画 片段 。 由 于 一 种 角色 的 所 有 动画 片段 都 要 徘 同一 副 骨 染 来 
实现 ， 因 此 这 些 动作 所 用 的 骨骼 块 数 都 是 相同 的 〈 尽 管 在 完成 菜 些 特定 
动作 时 可 能 有 部 分 骨骼 丝 树 不 动 ) 。 正 因 如 此 ， 我 们 就 能 通过 一 














个 unordered_map 数 据 结构 实例 来 存储 所 有 的 动画 片段 ， 并 根据 动画 片 
段 的 识别 名 称 来 引用 它们 : 


std: :unordered map<std::string, AnimationClip> mAnimations; 


AnimationClip& clip = mAnimations["attack"]; 





最 后 ， 正 如 之 前 所 提 到 的 ， 针 对 每 一 块 骨 能 ， 我 们 都 需要 利用 偏 移 
变换 ， 将 受到 其 影响 的 诸 育 肤 顶 点 从 绑 定 空间 变换 至 该 骨骼 空间 。 忆 
外 ， 我 们 还 需要 以 茶 种 方式 来 表示 骨架 的 层次 结构 “这 里 用 的 是 一 个 数 
组 一 一 具体 实现 可 详 见 下 一 小 节 ) 。 下 面 介绍 存储 骨架 动画 数据 的 最 终 
变换 数据 结构 。 














class SkinnedData 


{ 
public: 


UINT BoneCount()const ; 


float GetClipStartTime(const std: :string& clipName)const; 
float GetClipEndTime(const std::string& clipName)const; 


void Set( 
std: :vector<int>& boneHierarchy, 
std: :Vector<DirectX: :XMFLOAT4X4>& boneOffsets, 
std: :unordered map<std::string, AnimationClip>& animations ) ; 





// 在 实际 的 项 目 中 ， 如 果 需 要 调用 clipName 这 一 动画 片段 中 同一 timePos 时 刻 的 动画 多 
次 ， 我 们 可 能 
// 就 会 渔 望 将 此 最 终 变 换 的 结果 缓存 下 来 
void GetFinalTransforms(const std: :string& clipName, float timePos， 
std: :vector<DirectX: :XMFLOAT4X4>& finalTransforms)const; 


























private: 
// 用 于 给 出 第 i 块 骨 骼 的 父 对 象 索 引 


std: :vector<int> mBoneHierarchy:; 








std: :Vector<DirectX: :XMFLOAT4X4> mBoneOffsets; 


std: :unordered map<std::string, AnimationClip> mAnimations ; 


}; 
23.2.5 ”计算 最 终 变 换 


一 款 角色 的 框架 层次 往往 用 类 似 于 图 23.2 所 示 的 树 状 结构 来 表示 。 
我 们 采用 整 型 数组 来 模拟 这 种 层次 结构 ， 即 用 第 ;个 数组 元 素 给 出 第 ; 抉 
骨骼 的 父 对 象 索引 。 同 时 ， 还 可 用 索引 ;来 指示 当前 动画 片段 中 对 应 的 
第 i 个 BoneAnimation 以 及 第 i 个 偏 移 变换 。 而 没有 父 对 象 的 根 骨 骼 总 是 
处 于 元 素 0 的 位 置 。 因 此 ， 肯 骼 ;的 祖父 对 象 的 动画 数据 以 及 偏 移 变换 就 
可 以 按 以 下 方式 获得 : 




















int parentIndex = mBoneHierarchy[i]; 
int grandParentIndex = mBoneHierarchy[parentIndex]; 


XMFLOAT4X4 offset = mBoneOffsets[grandParentIndex]; 


mAnimations["attack"]; 
clip.BoneAnimations[grandParentIndex]; 


AnimationClip& clip 
BoneAnimation& anim 





也 可 以 据 此 计算 出 每 块 骨骼 的 最 终 变 换 ， 如 : 





void SkinnedData: :GetFinalTransforms(const std::string& clipName, 
float timePos，std: :vector<XMFLOAT4X4>& finalTransforms)const 


{ 


UINT numBones = mBoneOffsets.size(); 


std: :Vector<XMFLOAT4X4> toParentTransforms(numBones ) ; 





// 根据 给 定 的 时 间 点 对 此 动画 片段 中 的 所 有 上 骨骼 进行 插值 
auto clip = mAnimations.find(clipName); 
clip->second.Interpolate(timePos，toParentTransforms ) ; 


// 
// 遍历 该 层次 结构 并 将 所 有 的 骨骼 变换 至 根 空间 
// 








std: :Vector<XMFLOAT4X4> toRootTransforms(numBones ) ; 


// 根 骨骼 的 索引 为 96。 由 于 根 上 骨骼 没有 父 对 象 ， 因 此 它 的 至 根 坐 标 系 变换 即 为 其 自身 局 部 
骨骼 空间 的 变换 


toRootTransforms[6] = toParentTransforms[6] ; 




















// 现在 来 求 出 子 对 象 们 的 至 根 坐 标 系 变换 
for(UINT i = 1; i «< numBones; ++i) 


{ 
XMMATRIX toParent = XMLoadFloat4x4(&toparentTransforms[i]); 








int parentIndex = mBoneHierarchy[i]; 
XMMATRIX parentToRoot = XMLoadFloat4x4(&toRootTransforms[parentIndex]) 
XMMATRIX toRoot = XMMatrixMultiply(toPparent, parentToRoot); 


XMStoreFloat4x4(&toRootTransforms[i], toRoot); 
} 











令 骨 骼 的 偏 移 变 换 乘 以 至 根 坐标 系 变换 来 求 得 最 终 变换 
for(UINT i = 6; i < numBones; ++i) 
{ 
XMMATRIX offset = XMLoadFloat4x4(&mBoneOffsets[i]); 
XMMATRIX toRoot = XMLoadFloat4x4(&toRootTransforms[i]); 
XMStoreFloat4x4(&finalTransforms[i], XMMatrixMultiply(offset, 
toRoot)); 





此 时 ， 在 变换 阶段 还 需 实现 一 项 重要 的 细节 。 在 循环 中 遍历 每 块 骨 
骼 的 时 候 ， 我 们 要 获取 当前 骨骼 父 对 象 的 至 根 坐 标 系 变 换 : 





int parentIndex = mBoneHierarchy[i]; 
XMMATRIX parentToRoot = XMLoadF1Loat4x4(&toRootTransforms[parentIndex]) ; 





只 有 在 循环 中 最 先 求 出 父 骨 骼 的 “至 根 坐 标 系 变换 ”， 才 能 保证 这 项 
工作 正确 而 顺利 地 执行 下 去 。 事 实 上 ， 如 果 我 们 能 够 确保 数组 中 的 每 块 
子 骨 骼 都 在 其 父 骨 骼 之 后 的 这 一 顺 夺 ， 即 可 满足 上 述 条 件 。 而 且 ， 例 程 
己 经 依 此 生成 了 适当 的 数据 。 以 下 是 某 个 角色 模型 层次 结构 数组 中 前 10 


块 骨骼 的 数据 片段 : 


1 
卢 


ParentIndexOfBonee : 
ParentIndexOfBone1l: 
ParentIndexOfBone2 : 
ParentIndexOfBone3 : 
ParentIndexOfBone4: 


ParentIndexOfBone5 : 
ParentIndexOfBone6 : 
ParentIndexOfBone7 : 
ParentIndexOfBones8 : 
ParentIndexOfBone9 : 


oomaam 上 ww QQ 





因此 ， 上 骨骼 9 的 父 对 象 为 骨骼 8、 肯 骼 8 的 父 对 象 为 骨骼 5、 上 骨骼 5 的 
父 对 象 为 骨骼 4、 和 骨骼 4 的 父 对 象 为 骨骼 3 En 骨 
骼 2 的 父 对 象 则 为 根 节点 骨骼 0。 由 此 便 可 以 看 出 ， 父 骨骼 在 数组 中 的 位 

置 从 未 被 其 子 骨 骼 超越 。 


23.3 ”顶点 混合 











我 们 刚刚 展示 了 如 何 来 令 骨 架 运 动 。 在 本 节 中 ， 我 们 将 把 注意 力 聚 
焦 在 张 动 附着 于 骨架 上 的 皮肤 《〈 即 蒙 弃 ) 。 本 书 实现 此 功能 所 采用 的 算 
法 称 为 顶点 混合 (vertex blending) 。 


顶点 混合 算法 的 策略 如 下 。 在 皮肤 之 下 即 为 呈 层 次 结构 的 骨骼 系 
统 ， 而 蒙 皮 本 身 是 一 段 连 续 的 网 格 〈 这 就 是 说 ， 不 能 把 蒙 皮 按 骨 骼 模型 
相应 地 划分 成 若干 部 分 后 再 分 别 驱动 它们 ) 。 由 于 皮肤 上 的 同一 个 顶点 
可 能 受到 一 块 或 多 块 骨 骼 影响 ， 因 此 最 终 的 蒙 皮 效 果 要 根据 牵动 它 的 各 
块 骨 骼 的 最 终 变换 的 加 权 平 均值 来 确定 《这些 权 值 由 美工 在 创建 模型 时 
指定 并 将 之 保存 在 文件 中 ) 。 这 样 一 来 ， 即 可 在 关 市 处 (这 通常 是 令 人 
头疼 的 重点 灾区 〉 实现 平滑 的 渐变 混合 效果 ， 以 此 令 皮 肤 表现 得 富有 弹 
性 。 效 果 如 图 23.8 所 示 。 











| 肯 骨 4 | 背 铝 8 | 
(a) (b) 


图 23.8 ”皮肤 是 一 块 附 着 于 骨骼 的 连续 网 格 。 由 图 中 可 以 看 出 ， 关 节 附 近 的 顶点 被 骨骼 和 4 与 骨 
散 妃 同时 牵动 ， 以 此 为 基础 即 可 创建 出 平滑 的 渐变 混合 效果 来 模拟 富有 弹性 的 皮肤 
































[Moller08] 提 出 : 在 实践 的 过 程 中 ， 最 好 不 要 令 同 一 项 点 受到 多 于 4 
块 骨骼 的 影响 。 因 此 ， 在 设计 中 惑 要 考虑 到 每 个 顶点 最 多 由 4 块 骨 骼 来 


驱动 这 一 因素 。 这 样 ， 为 了 实现 顶点 混合 技术 ， 我 们 将 会 把 角色 的 皮肤 
网 格 模拟 为 一 块 连续 的 网 格 。 其 中 ， 每 一 个 顶点 都 含有 有 至 多 4 个 索引 ， 
以 此 对 最 终 变 换 和 矩阵 所 构成 的 数组 “骨骼 是 阵 调 色 板 (bone matrix 
palette， 骨 架 中 的 每 块 骨骼 都 与 该 数组 中 的 元 素 一 一 对 应 ) ”进行 索 
另外 ， 每 个 顶点 也 最 多 有 4 个 权 值 ， 分 别 用 来 描述 每 块 骨骼 对 顶点 影响 
的 程度 。 据 此 ， 我 们 就 得 到 了 实现 顶点 混合 所 用 的 顶点 结构 体 〈 见 图 
23.9) 。 














O 









矩阵 调 色 板 


struct SkinnedVertex 

{ 
XMFLOAT3 Pos; 
XMFLOAT3 Normal; 
XMFLOAT2 TexC; 
XMFLOAT4 TangentU; 
XMFLOAT3 Bone Weights; 
BYTE Bonelndices[4]; 


图 23.9 矩阵 调 色 板 存储 着 每 块 骨骼 的 最 终 变换 。 从 图 中 可 以 看 出 其 中 的 4 个 骨骼 索引 是 怎样 在 

矩阵 调 色 板 中 引用 对 应 的 最 终 变换 的 。 同 时 ， 这 些 骨 骼 索引 也 反映 出 是 骨架 中 的 哪些 骨骼 在 从 

动 着 不 同 的 皮肤 项 点。 值得 注意 的 是 ， 顶 点 未 必 刚 好 被 4 块 骨 嵩 牵动 。 例 如 ，4 个 索引 里 可 能 

用 到 了 两 个 ， 也 就 是 说 ， 此 时 只 有 两 块 骨骼 在 影响 着 目标 项 点。 我 们 也 可 以 把 某 块 骨骼 的 权 值 
设置 为 0%， 从 而 去 挥 此 骨骼 对 目标 顶点 的 影响 












































如 果 为 实现 顶点 混合 而 令 一 块 连续 网 格 中 的 顶点 采用 上 述 格 式 ， 我 
们 束 称 此 网 格 为 驼 皮 网 格 (skinned mesh) 。 


通过 下 列 加 权 平 均值 公式 ， 即 可 求 出 任何 顶点 v 相 对 于 根 标 架 的 顶 
点 泥 合 位 置 (vertex-blended position) w (注意 不 要 忘记 ， 当 所 有 的 物 





体 都 处 于 根 坐标 系 中 时 ， 还 需要 在 最 后 的 步骤 中 进行 世界 变换 ， 将 它们 
变换 至 世界 空间 ) : 


VU -一 wvF'o 下 wvFl 十 wovuF', 于 wavuF> 
其 中 wo 二 wi 十 wz 十 wa 二 1， 即 权 值 之 和 为 1。 
从 公式 中 可 以 看 出 ， 我 们 在 变换 茶 个 指定 的 项 皮 v 时 ， 要 按 对 其 产 


影响 的 骨骼 最 终 变 换 ( 即 矩阵 Fo、 了 1、F2、F3) 单独 进行 计算 。 接 
着 ， 再 分 别 求 出 这 些 变换 点 的 加 权 平 均值 ， 以 计算 出 该 项 点 的 最 终 混 合 
位 置 v'。 


法 线 与 切线 的 变换 与 之 相似 : 


ff . 1 \ 
n = normalize(wonFo + winF + wnF + wnFs) 
t’ = normalize(wotFo + wtF + wotF, + watFs) 


a 
需要 在 对 法 线 进行 变换 时 ， 使 用 该 矩阵 的 逆转 置 矩 阵 LEF5 ) (参见 8.2.2 
Ts 





下 列 顶点 着 色 器 片段 展示 了 当 每 个 顶点 最 多 被 4 个 骨骼 影响 时 ， 
现 顶点 混合 技术 所 用 的 关键 代码 : 





cbuffer cbSkinned : register(b1) 


{ 
// 每 个 角色 最 多 允许 由 96 块 骨骼 构成 
float4x4 gBoneTransforms[96] 
}; 

















struct VertexIn 


float3 PosL : POSITION; 


float3 NormalL : NORMAL ; 

float2 TexC : TEXCOORD ; 

float3 TangentL : TANGENT; 
#ifdef SKINNED 

float3 BoneWeights : WEIGHTS; 

uint4 BoneIndices : BONEINDICES; 
#endif 


}; 


struct VertexOut 

{ 
float4 PosH : SV_POSITION; 
float4 ShadowPosH : POSITION6 ; 
float4 SsaoPosH : POSITION1 ; 
float3 PosW : POSITION2; 
float3 NormalW : NORMAL ; 
float3 TangentW : TANGENT 
float2 TexC : TEXCOORD ; 


}; 


VertexOut VS(VertexIn vin) 


{ 
VertexOut vout = (VertexOut)0.0ef; 





// 获取 材质 数据 
MaterialData matData = gMaterialData[gMaterialIndex]; 


#ifdef SKINNED 
float weights[4] = { 8.6f, 68.6f, 6.6f, 68.6f }; 
weights[6] = vin.BoneWeights.x; 
weights[1] = vin.BoneWeights.y; 
weights[2] = vin.BoneWeights.z; 
weights[3] 1.6f - weights[6] - weights[1] - weights[2]; 


float3 posL = float3(6.06f，6.6f，6.6f) 
float3 normalL = float3(6.6f, 6.6f, 8.6f); 
float3 tangentL = float3(6.6f, 60.6f, 08.6f); 
for(int i = 6j i < 4; ++i) 

















{ 
// 假设 在 对 法 线 进行 变换 时 ， 采 用 的 并 不 是 非 等 比 缩放 ， 因 此 也 就 不 必 使 用 北 转 置 矩 阵 
7 


posL += weights[i] * mul(float4(vin.PosL, 1.6f), 
gBoneTransforms[vin.BoneIndices[i]]).xyz; 
normalL += weights[i] * mul(vin.NormalL， 
(float3x3)gBoneTransforms[vin.BoneIndices[i]]); 
tangentL += weights[i] * mul(vin.TangentL .xyz, 
(float3x3)gBoneTransforms[vin.BoneIndices[i]]); 


} 


vin.PosL = posL 

vin.NormalL = normall; 

vin.TangentL.xyz = tangenttL; 
#endif 

















// 将 顶点 变换 至 世界 空间 
float4 posW = mul(float4(vin.PosL, 1.6f), gWorld); 
vout .PosN = posW.xyz; 


// 假设 执行 的 是 均匀 缩放 ， 否 则 就 需要 使 用 世界 矩阵 的 逆转 置 针 
vout .NormalN = mul(vin.NormalL, (float3x3)gWorld); 
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vout.TangentW = mul(vin.TangentL, (float3x3)gWorld); 














// 将 顶点 变换 到 齐 次 裁剪 空间 
vout .PosH = mul(posNW，gViewProj); 





// 为 将 SSAO0 图 投 财 到 场景 之 中 而 生成 相应 的 投影 纹理 坐标 


vout.SsaoPosH = mul(posW, gViewProjTex); 


站 





// 为 三 角形 内 插 而 输出 项 点 属 | 
float4 texC = mul(float4(vin.TexC, 68.6f, 1.6f), gTexTransform); 
vout.TexC = mul(texC, matData.MatTransform) .xy; 





一 汪 
































// 为 投影 场景 的 阴影 图 而 生成 相应 的 投影 纹理 坐标 


vout .ShadowPosH = mul(posW, gShadowTransform); 











return vout; 





如 果 上 述 顶点 着 色 器 是 按 “ 每 个 顶点 最 多 被 4 个 骨骼 所 牵动 ”来 进行 
顶点 混合 的 ， 那 么 为 什么 在 处 理 每 个 顶点 时 仅 输入 3 种 权 值 而 非 4 种 权 值 
呢 ? 原因 在 于 前 面 讲 过 的 权 值 总 和 必 为 1。 因 此 ， 要 求 出 这 第 4 个 权 值 有 


LU0 十 1 十 2 十 由 3 三 工会 由 三 工 一 200 一 11 一 2。 








23.4 ”从 文件 中 加 载 动画 数据 





我 们 用 文本 文件 来 存储 3D 壹 皮 网 格 以 及 动画 数据 ， 并 称 这 种 
以 .m3d 作 为 扩展 名 的 文件 为 “3D 模 型 ”文件 。 此 文件 格式 是 按照 易 加 载 和 
可 该 性 强 这 两 点 来 设计 的 ， 并 非 出 于 高 性 能 这 一 目的 ， 因 而 这 种 格式 仅 
用 于 本 书 中 的 演示 程序 。 


23.4.1 文件 头 


首先 ，.m3d 格 式 定义 的 文件 头 指定 了 构成 模型 所 需 的 材质 、 顶 点 、 
网 格 三 角形 、 骨 骼 以 及 动画 片段 的 数量 。 负 
米 米 炒米 米 米 米 米 米 米 米 米 米 炒米 m3d-Fjile-Header 米 炒米 炒米 炒米 米 米 米 米 米 米 炒米 


#Materials 3 
#Vertices 3121 


#Triangles 4662 
#Bones 44 
#AnimationClips 15 





1. #Materials: 网 格 所 用 的 不 同 材质 数量 。 
2. #Vertices: 网 格 使 用 的 顶点 数量 。 

3. #Triangles: 构成 网 格 的 三 角形 数量 。 
4. #Bones: 网 格 中 骨骼 的 数量 。 


5. #AnimationClips: 网 格 中 动画 片段 的 数量 。 


23.4.2 材质 





.n3d 格 式 中 的 下 一 个 “区 块 ? 内 容 为 一 系列 材质 列表 。 下 面 的 示例 为 
soldier.m3d 文 件 中 的 前 两 种 材质 。 


六 米 阔 阔 阔 六 炒米 炒米 米 米 六 炒米 Ma 七 erialS 米 米 米 炒米 炒米 米 米 炒米 米 米 米 米 六 六 六 炒米 六 


Name: soldier head 
Diffuse: 111 

Fresne16: 6.65 6.65 6.65 
Roughness: 6.5 

AlphaClip: 6 
MaterialTypeName: Skinned 
DiffuseMap: head diff.dds 
NormalMap: head norm.dds 


Name: soldier jacket 
Diffuse: 111 
Fresne16: 6.65 0.65 6.65 


Roughness: 6.8 

AlphaClip: 6 
MaterialTypeName: Skinned 
DiffuseMap: jacket diff.dds 
NormalMap: jacket norm.dds 





此 文件 中 含有 我 们 捷 熟 知 的 材质 数据 《〈 慢 反射 光 、 粗 糙 度 等 ) ， 但 
古 也 包括 一 些 和 额外 信息 ， 如 即将 使 用 的 纹理 、 是 否 要 进行 alpha 裁 驳 以 及 
材质 类 型 名 称 。 材 质 类 型 名 称 指 出 了 哪些 着 色 需 程序 需要 使 用 当前 所 给 
定 的 材质 。 在 上 面 的 例子 中 , “Skinned”(〈 蒙 皮 ) 类 型 说 明了 在 支持 蒙 皮 
处 理 的 着 色 器 程序 中 会 用 到 这 种 材质 进行 泻 染 。 





23.4.3 子 集 


一 整 副 网 格 是 由 一 个 或 多 个 子 集 构成 的 。 一 个 于 集 〈subset) 即 为 


网 格 中 可 以 用 同一 种 材质 进行 泻 染 的 一 组 三 角形 。 图 23.10 详 细 展 示 了 
如 何 把 一 个 表示 汽车 的 网 格 划分 为 在 干 子 集 。 


子 集 3 窗口 : 
通过 窗口 的 属性 来 从 
染 该 子 集中 的 三 角形 


子 集 0 前 照 灯 : 
通过 前 照 灯 属性 来 泻 
染 该 子 集中 的 三 角形 


子 集 1 转 向 类 : 
通过 转向 灯 必 性 来 泻 
染 该 子 集中 的 三 角形 


子 集 2 轮 胎 : 子 集 4 车 体 : 
通过 轮胎 属性 来 渲染 通过 车 体 属性 来 演 染 
该 子 集中 的 三 角形 该 子 集中 的 三 角形 

















图 23.10 一 辆 汽车 的 网 格 可 以 划分 为 若干 子 集 。 在 此 假设 每 个 子 集 的 区 别 仅 在 于 材质 。 其 实 我 

们 也 可 以 想象 得 到 ， 在 实际 应 用 中 也 可 能 存在 对 不 同 纹理 运用 加 减 混合 的 情况 。 另 外 ， 不 同 子 

集 的 泻 染 状态 也 可 能 各 异 。 例 如 ， 玻 璃 窗 可 以 用 alpha 混 合 的 泻 染 方式 来 营造 透明 的 效果 。 因 此 
这 些 都 可 以 作为 划分 子 集 的 依据 


























子 集 与 材质 一 一 对 应 ， 即 第 ;个 子 集 对 应 于 第 ;种 材质 。 换 名 话说 ， 
第 i 个 子 集 定义 的 是 一 段 应 由 第 i 种 材质 来 加 以 泻 染 的 连续 多 个 几何 体 图 
形 。 


六 炒米 米 米 米 米 炒米 米 米 米 米 米 炒 SubsetTablje@ 米 米 米 米 米 米 米 米 米 米 米 米 米 炒米 米 米 米 米 


SubsetID: 6 VertexStart: 6 VertexCount: 3915 FaceStart: 6 FaceCount: 7236 
SubsetID: 1 VertexStart: 3915 VertexCount: 2984 FaceStart: 7236 FaceCount: 
4449 

SubsetID: 2 VertexStart: 6899 VertexCount: 42706 FaceStart: 11679 FaceCount 


: 6579 

SubsetID: 3 VertexStart: 11169 VertexCount: 2365 FaceStart: 18258 FaceCoun 
七 : 3807 

SubsetID: 4 VertexStart: 13474 VertexCount: 274 FaceStart: 226065 FaceCount 
: 442 





在 上 面 的 示例 中 ， 第 一 个 网 格 〈 即 引用 顶点 [0, 3915) 的 网 格 ) 中 的 
7230 个 三 角形 应 当 用 材质 0 来 泻 染 ， 而 其 后 网 格 〈 即 引用 顶点 [3915， 
6899) 的 网 格 ) 中 的 4449 个 三 角形 应 该 以 材质 1 来 泻 染 。 


23.4.4 ”顶点 数据 与 三 角形 








接 下 来 的 两 个 数据 区 块 只 是 罗列 出 了 一 系列 的 顶点 与 索引 《每 个 三 
角形 都 有 3 个 对 应 的 索引 ) 。 





米 米 炒米 米 米 米 米 米 米 米 米 米 米 米 We 七 ICeS 米 炒米 米 米 炒米 炒米 米 米 米 米 米 米 米 米 米 米 米 米 米 


Position: -14.34667 96.44742 -12.68929 

Tangent: -6.3669677 86.2756875 6.9111171 1 
Normal: -6.3731641 -868.9154652 6.150721 
Tex-Coords: 6.21795 8.165219 

BlendWeights: 6.483457 6.483457 6.6194 8.613686 
BlendIndices: 3 2 39 34 


Position: -15.87868 94.66355 9.362272 

Tangent: -6.3669676 8.2756875 6.9111172 1 
Normal: -6.3731641 -8.9154652 6.150721 
Tex-Coords: 6.278234 68.691931 

BlendWeights: 6.4985979 86.4985979 8.662864151 6 
BlendIndices: 39 2 3 6 


烙 业 本 本本 汪 本 水 汪 迪 米 环 玉林 本 下 本 下 和 区 二 全 SS 汪汪 玉 可 本 党 刺 本 本本 本 本 汪汪 水 出 环 束 本 求 业 


8 1 2 
345 

6 7 8 

9 16 11 
12 13 14 





23.4.5 ”骨骼 偏 移 变 换 


骨骼 偶 移 变换 区 块 仅 为 每 块 骨骼 都 存储 了 一 个 4 x 4 偏 移 变 换 和 矩阵 。 


米 米 炒米 米 米 米 米 米 米 米 米 米 米 米 BOmeO 和 和 Se 七 S 米 炒米 炒米 米 米 炒米 米 米 米 米 米 米 米 米 炒米 


BoneOffset6 -6.8669753 6.4982696 6.61187624 6 
96.64897417 0.1688967 -6.9928461 6 

-0.4959392 -6.8601914 -6.118865 0 

-16.94755 -14.61919 96.63566 1 


BoneOffset1 1 4.884964E-67 3.625227E-67 6 
-3.145564E-67 2.163151E-67 -1 6 
4.884964E-67 6.9999997 -9.59325E-08 6 
3.284225 7.236738 1.556451 1 








23.4.6 ”层次 结构 


层次 结构 区 块 存储 的 是 层次 结构 数组 ， 即 一 个 整 型 数组 ， 第 ;个 数 
组 元 素 保存 的 就 是 第 ;其 骨骼 的 父 索 








O 


米 六 六 米 米 六 六 六 六 六 六 六 六 六 六 BoneHierarchy 六 六 六 六 六 米 米 六 六 六 六 六 六 六 六 六 六 


ParentIndexOofBone6: -1 
ParentIndexOfBone1l: 
ParentIndexOfBone2 : 
ParentIndexOfBone3 : 
ParentIndexOfBone4: 
ParentIndexOfBone5 : 
ParentIndexOfBone6 : 
ParentIndexOfBone7 : 
ParentIndexOfBones8 : 
ParentIndexOfBone9 : 
ParentIndexOofBone16 : 
ParentIndexOfBone11: 
ParentIndexOfBone12 : 
ParentIndexOofBone13 : 


vvIOm 上 上 上 wm 


7 
7 
6 
1 


2 





23.4.7 动画 数据 


最 后 一 个 区 块 所 存 的 惑 是 我 们 需要 读 取 的 动画 片段 。 每 一 段 动画 都 


有 一 一 个 识 


只 别名 称 以 及 针对 骨架 中 每 一 块 骨骼 的 一 系列 关键 帧 ， 而 每 一 个 








关键 帧 又 存储 着 时 间 点 、 用 于 指定 骨骼 位 置 的 平移 同 量 、 用 于 指定 骨骼 
大 小 的 缩放 回 量 以 及 指定 肯 骼 朝 同 的 四 元 数 。 





i dott yb Met iol el bod dotde idntodd ot si 


AnimationClip run _ loop 


Bone6 #Keyframes: 18 


Time: 6 Pos: 2.538344 161.6727 -86.52932 

Scale: 1 1 1 

Quat: 6.4642651 6.3919331 -9.5853591 6.5833637 
Time: 868.6666666 

Pos: 0.81979 169.6893 -1.575387 

Scale: 0.9999998 68.9999998 8.9999998 

Quat: 68.4466441 6.3467651 -68.5356612 8.6276384 


Bonel #Keyframes: 18 


{ 
{ 
} 
{ 
} 


Time: 6 

Pos: 36.48329 1.210869 92.7378 

Scale: 1 1 1 

Quat: 6.126642 9.1367731 96.69165 8.6983587 
Time: 86.9666666 

Pos: 36.36672 -2.835898 93.15854 

Scale: 1 1 1 

Quat: 6.1284661 6.1335271 86.6239273 8.7592883 


AnimationClip walk_ loop 


{ 


Bone6 #kKeyframes: 33 


{ 


Time: 6 

Pos: 1.418595 98.13201 -6.051082 

Scale: 90.9999985 8.999999 8.9999991 

Quat : 06.3164562 6.6437552 -90.6428624 0.2686314 


Time: 6.9333333 

Pos: 0.956679 96.42985 -8.6047988 

Scale: 6.9999999 868.9999999 8.9999999 

Quat: 6.32560651 6.6395872 -9.6386833 6.2781691 


} 


Bonel #Keyframes: 33 
{ 
Time: 6 
Pos: -5.831432 2.521564 93.75848 
Scale: 0.9999995 68.9999995 1 
Quat : -6.033817 -6.60606631665 6.9697761 6.4137191 
Time: 8.0333333 
Pos: -5.688324 2.551427 93.71678 
Scale: 0.9999998 86.9999998 1 
Quat : -6.0332602 -0.0606063966021 6.963874 8686.426568 





下 列 代码 展示 了 从 文件 中 读 取 动 画 片段 数据 的 方法 。 





void M3DLoader::ReadAnimationClips( 
std::ifstream& fin, 
UINT numBones, 
UINT numAnimationClips, 
std: :unordered mapx<std::string, 
AnimationClip>& animations) 


std::string ignore; 
fin >> ignore; // AnimationClips 的 头 部 文本 
for(UINT clipIndex = 6; clipIndex < numAnimationClips; ++clipIndex) 
{ 
std::string clipName; 
fin >> ignore >> clipName; 
fin >> ignore; // { 


AnimationClip clip; 
clip.BoneAnimations.resize(numBones); 


for(UINT boneIndex = 6; boneIndex < numBones; ++boneIndex) 


{ 


ReadBoneKeyframes(fin, numBones, clip.BoneAnimations[boneIndex]); 


} 


fin >> ignore; // } 


animations[clipName]|] = clip; 
} 
} 


void M3DLoader: :ReadBoneKeyframes( 
std::ifstream& fin, 
UINT numBones, 
BoneAnimation& boneAnimation) 


std::string ignore; 

UINT numKeyframes = 0; 

fin >> ignore >> ignore >> numKeyframes; 
fin >> ignore; // { 


boneAnimation.Keyframes.resize(numKeyframes ) ; 
for(UINT i = 8; i < numKeyframes; ++i) 
{ 
float t = 0.0f; 
XMFLOAT3 p(6.6f，6 
XMFLOAT3 s(1.6f, 1 
XMFLOAT4 q(6.6f, 0@. 
fin >> ignore >> 七 
fin >> ignore >> p.x >> p.y >> p.2z; 
fin >> ignore >> S.X >> s.y >> s.2; 
fin >> ignore >> q.X >> q.y >> q.z >> q.w; 


boneAnimation.Keyframes[i].TimePos = 七 ; 
boneAnimation.Keyframes[i].Translation = p; 
boneAnimation.Keyframes[i].Scale = 0 
boneAnimation.Keyframes[i].RotationQuat = q; 


} 


fin >> ignore; // } 


} 


23.4.8 ”M3DLoader 类 


从 .m3d 文 件 中 加 载 数据 的 代码 都 位 于 LoadM3D.h/.cpp 文 件 中 ， 


y 
/ 





是 LoadM3d 函 数 。 





bool M3DLoader : :LoadM3d( 
const std: :string& filename， 
std: :Vector<SkinnedVertex>& vertices, 
std: :Vector<USHORT>& indices， 
std: :Vector<Subset>& subsets, 
std: :Vector<M3dMaterial>& mats， 
SkinnedData& skinInfo) 


std: :ifstream fin(filename); 


UINT numMaterials = 0; 
UINT numVertices = 60; 
UINT numTriangles = 
UINT numBones = 0; 

UINT numAnimationClips = 60; 


了 


std: :string ignore; 


if( fin ) 
{ 





fin >> ignore; // 文件 的 头 文本 

fin >> ignore >> numMaterials; 

fin >> ignore >> numVertices; 

fin >> ignore >> numTriangles; 

fin >> ignore >> numBones 

fin >> ignore >> numAnimationClips; 


std: :vector<XMFLOAT4X4> boneOffsets; 
std: :vector<int> boneIndexToParentIndex ; 
std: :unordered map<std::string, AnimationClip> animations ; 


ReadMaterials(fin, numMaterials, mats); 

ReadSubsetTable(fin, numMaterials, subsets); 
ReadSkinnedVertices(fin, numVertices, vertices); 
ReadTriangles(fin, numTriangles, indices); 

ReadBoneOffsets(fin, numBones, boneOffsets); 
ReadBoneHierarchy(fin, numBones, boneIndexToParentIndex); 
ReadAnimationClips(fin, numBones, numAnimationClips, animations); 


skinInfo.Set(boneIndexToParentIndex, boneOffsets, animations); 
return true; 


} 


return false; 


D 

像 ReadMaterials 这 样 的 辅助 函数 实则 都 是 用 std: :ifstream 也 | 
数 直接 对 文本 文件 进行 解析 。 我 们 把 这 些 函 数 的 具体 细节 留 给 读者 在 阅 
读 源 代码 时 进行 研究 。 


23.5 ”角色 动画 演示 程序 


正如 我 们 在 驼 皮 网 格 着 色 器 代码 中 所 看 到 的 ， 骨 骼 的 最 终 变 换 都 存 
于 一 个 常量 缓冲 区 中 ， 在 顶点 着 色 器 进行 动画 变换 时 将 用 到 它们 。 





cbuffer cbSkinned : register(b1) 





{ 
// 每 个 角色 最 多 支持 96 块 骨骼 
float4x4 gBoneTransforms[96]; 


}; 

















因此 ， 我 们 还 需要 为 处 理 每 一 个 蒙 皮 网 格 对 象 ， 而 疝 帧 资源 之 中 的 
添加 一 个 常量 缓冲 区 如 下 。 


struct SkinnedConstants 


{ 
DirectX: :XMFLOAT4X4 BoneTransforms[96]; 
}; 


std: :unique ptr<UploadBuffer<SkinnedConstants>> SkinnedCB = nullptr; 


SkinnedCB = std::make unique<UploadBuffer<SkinnedConstants>>( 
device, skinnedObjectCount, true); 





我 们 需要 为 每 一 个 动画 角色 的 实例 都 设置 一 个 skinnedConstants 
结构 体 。 一 个 动画 角色 实例 通常 由 多 个 演 染 项 (每 种 材质 都 对 应 一 个 泻 
染 项 ) 组 成 ， 但 是 同一 个 角色 实例 的 所 有 泻 染 项 可 以 共享 同一 
个 SkinnedConstants， 这 是 因为 文 持 某 一 蒙 皮 网 格 运动 的 背后 使 用 的 
都 是 同一 组 骨骼 系统 。 


为 了 呈现 动画 角色 实例 在 特定 时 刻 的 动作 ， 我 们 定义 了 下 列 结构 


体 。 


struct SkinnedModelInstance 


{ 
SkinnedData* SkinnedInfo = nullptr; 





// 用 于 存储 给 定时 间 点 的 最 终 变 换 
std: :vector<DirectX: :XMFLOAT4X4> FinalTransforms; 





// 当前 的 动画 片段 名 称 
std: :string ClipName; 


// 动画 时 间 点 
float TimePos = 68.6f; 




















// 每 一 帧 都 要 调用 此 函数 ， 以 推进 时 间 点 的 位 置 、 基 于 当前 的 动画 片段 对 每 一 块 骨骼 进行 
插值 ， 并 为 顶点 

// 着 色 器 中 的 处 理 流程 生成 最 后 应 用 于 动画 效果 的 最 终 变换 

void UpdateSkinnedAnimation(float dt) 

{ 


TimePos += dt; 






















































































// 使 动画 循环 播放 
if(TimePos > SkinnedInfo->GetClipEndTime(ClipName)) 
TimePos = 60.0f; 





// 为 当前 的 时 间 点 计算 最 终 变 换 
SkinnedInfo->GetFinalTransforms(ClipName, TimePos, 
FinalTransforms ) ; 





接 下 来 ， 辐 演 染 项 结构 体 添加 下 列 数据 成 员 。 





struct RenderItem 


{ 








[aa 
// 指 问 骨骼 变换 常量 缓冲 区 的 索引 。 仪 用 于 与 蒙 及 相关 的 泻 染 项 
UINT SkinnedCBIndex = -1; 








// 指向 与 此 演 染 项 相关 联 的 动画 实例 的 指针 

// 如 果 该 泻 染 项 不 受 蒙 皮 网 格 的 驱动 ， 就 将 其 设 为 nullptr 
SkinnedModelInstance* SkinnedModelInst = nullptr; 
Ls 

















}; 
我 们 要 在 每 一 帧 都 对 动画 角色 实例 进行 更 新 (在 本 章 的 演示 程序 中 
其 实 只 有 一 个 角色 实例 ) 。 


void SkinnedMeshApp: :UpdateskinnedCBs(const GameTimer& gt) 
{ 


auto currSkinnedCB = mCurrFrameResource->SkinnedCB.get(); 








// 仅 有 一 个 蒙 皮 模型 需要 驱动 
mSkinnedModelInst->UpdateSkinnedAnimation(gt.DeltaTime()); 


SkinnedConstants skinnedConstants ; 

std: :copy( 
std: :begin(mSkinnedModelInst->FinalTransforms), 
std: :end(mSkinnedModelInst->FinalTransforms), 
&skinnedConstants .BoneTransforms[8]); 


currSkinnedCB->CopyData(606, skinnedConstants); 





在 我 们 绘制 演 染 项 时 ， 如 果 录 个 泻 染 项 被 壹 皮 网 格 所 驱动 ， 那 么 为 
其 绑 定 与 乙 相 关 的 骨骼 最 终 变 换 。 


if(ri->SkinnedModelInst != nullptr) 


D3D12 GPU_ VIRTUAL ADDRESS skinnedCBAddress = 
skinnedCB->GetGPUVirtualAddress() + 
ri->SkinnedCBIndex*skinnedCBByteSize; 


cmdList->SetGraphicsRootConstantBufferView(1, skinnedCBAddress); 
} 


else 


{ 
cmdList->SetGraphicsRootConstantBufferView(1, 0); 


} 








图 23.11 所 示 的 是 本 章 演示 程序 的 一 张 效果 图 。 原 始 的 动画 模型 以 
及 纹理 都 出 自 DirectX SDK， 我 们 出 于 演示 的 目的 把 它们 转换 为 .m3d 格 


式 。 这 个 示例 模型 仅 有 一 段 名 为 Takel 的 动画 片段 。 
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图 23.11 “Skinned Mesh”( 蒙 皮 网 格 〉 演 示 程 序 的 效果 


23.6 ”小 结 


1. 我 们 希望 把 现实 世界 中 的 大 多 数 物体 分 解 成 具有 父子 对 象 关系 
的 多 个 组 成 部 分 ， 以 此 方式 来 将 它们 转换 为 计算 机 程序 中 的 图 形 化 模 
型 。 在 这 个 模型 中 ， 子 对 象 可 以 自己 相对 独立 地 运动 ， 但 是 当 其 父 对 象 
运动 时 ， 它 也 将 受 其 影响 而 随 之 运动 。 例 如 ， 坦 克 的 炮塔 可 以 相对 于 坦 
殉 上 自行 旋转 ， 但 是 它 仍 要 随 着 车 体 的 移动 而 移动 。 另 一 个 经 典 的 例子 是 
上 骨架， 骨骼 必须 随 其 依附 骨骼 的 运动 而 运动 。 考 虑 一 列 火 车 上 的 游戏 角 
色 。 角 色 可 以 在 列车 中 相对 独立 地 运动 ， 但 是 他 们 也 会 随 着 列车 的 行驶 
而 移动 。 这 个 例子 说 明 游 戏 中 对 象 的 层次 结构 是 可 以 动态 改变 的 ， 并 必 
须 时 时 更 新 。 即 在 角色 进入 列车 之 前 ， 列 车 并 不 是 该 角色 层次 结构 中 的 
一 员 。 一 旦 玩家 控制 角色 进入 了 列车 ， 那 么 列车 即刻 就 成 为 了 角色 层次 
结构 中 的 一 部 分 ( 即 角 色 继 承 了 火车 运动 的 变换 ， 所 以 也 有 人 把 “frame 
hierarchies” 译 作 “ 帧 继承 ”) 。 

















2. 网 格 层次 结构 中 的 每 一 个 对 象 都 是 相对 于 其 自身 的 局 部 坐标 系 
来 建 模 的 ， 并 根据 位 于 其 局 部 坐标 系 原 点 处 的 枢纽 关节 进行 旋转 。 由 于 
这 些 坐标 系 都 存在 于 同一 个 世界 空间 之 中 ， 因 此 就 能 表示 出 它们 之 间 的 
相对 关系 ， 继 而 通过 变换 把 菜 个 对 象 从 它 的 局 部 空间 变换 到 另 一 个 对 象 
的 局 部 空间 之 中 。 特 别 是 ， 我 们 能 够 以 此 来 摘 述 每 个 对 象 的 坐标 系 相对 
于 其 父 对 象 坐 标 系 的 关系 。 据 此 ， 我 们 就 可 以 通过 构建 至 父 坐 标 系 
(to-parent) 的 变换 矩阵 ， 将 一 个 对 象 的 几何 体 从 它 的 局 部 坐标 系 变 换 
至 其 父 坐 标 系 。 一 旦 该 对 象 位 于 其 父 坐标 系 之 中 ， 我 们 就 能 通过 其 父 对 





象 的 “至 父 坐标 系 窍 阵 ? 再 将 此 对 象 变换 到 其 祖父 对 象 的 坐标 系 内 ， 并 依 
此 类 推 ， 连 续 裔 历 每 一 个 祖先 对 象 的 坐标 系 ， 和 直到 最 终 抵 达 世 界 空间 。 
换言之 ， 为 了 将 网 格 层次 结构 中 的 一 个 对 象 从 其 局 部 空间 变换 至 世界 空 
间 ， 我 们 就 要 利用 此 对 象 乃 至 其 所 有 祖先 对 象 的 “至 父 坐 标 系 变 换 ”( 按 
升序 的 次 序 ) 沿 坐 标 系 层次 结构 上 小 ， 直 至 该 对 象 到 达 世 界 空间 。 如 此 
一 来 ， 目 标 对 象 束 会 继承 其 祖先 对 象 的 变换 ， 并 随 着 其 祖先 对 象 的 运动 
而 运动 。 


3 . 我 们 可 以 用 递归 关系 toRoot: = toParent; : toRootp 来 表示 第 i 块 骨 
窖 的 至 根 坐 标 系 变换 。 其 中 ，P 代 表 第 i 块 骨骼 的 父 骨 骼 。 





4. 骨 散 仿 移 变换 能 够 将 各 皮肤 项 点 从 绑 定 空间 变换 到 对 它们 产生 
影响 相应 骨骼 的 空间 。 骨 好 中 的 每 一 块 骨骼 都 有 一 个 与 之 对 应 的 侦 移 变 
换 。 





5. 在 实现 项 点 混合 技术 的 过 程 中 ， 使 用 的 蒙 皮 是 一 块 连续 的 网 
格 ， 皮 肤 的 下 面 是 呈 层 次 结构 的 骨骼 系统 ， 因 此 蒙 皮 上 的 项 点 可 能 受到 
一 块 或 一 块 以 上 骨骼 的 罕 扯 。 由 于 骨骼 对 顶点 的 影响 程度 取决 于 骨骼 日 
喘 的 权 值 。 因 此 ， 针 对 4 块 骨骼 影响 同一 个 顶点 的 情况 ， 我 们 可 用 加 权 
平均 公式 w = wovFo 十 wivF1 + w2vF2 + wavF 来 求 取 变 换 至 骨架 根 坐 标 
系 的 顶点 v， 其 中 wo + wi 二 WwW2 二 ws 二 1。 基 于 所 用 的 连续 网 格 以 及 每 一 
个 顶点 都 极 厨 二 加权 骨骼 所 影响 等 因素 ， 我 们 将 获得 一 种 更 为 目 然 的 弹 
性 绽 皮 效果 。 











6. 为 了 实现 项 反 混 全 技术， 我 们 将 每 一 块 骨骼 的 最 终 变 换 矩 阵 都 


存在 了 一 个 数组 (这 个 数组 称 为 矩阵 调 色 板 ，matrix palette) 之 中 《第 ; 
块 骨 髋 的 最 终 变 换 被 定义 为 Fi = ofseti toRooti:， 即 该 骨骼 的 偏 移 变 换 与 
其 至 根 坐 标 系 变换 的 乘积 ) 。 接 下 来 ， 我 们 还 针对 每 一 个 顶点 保存 了 一 
系列 顶点 权重 以 及 矩阵 调 色 板 索 引 。 而 一 个 顶点 的 矩阵 调 色 板 索 引 则 用 
于 找 出 影响 着 此 顶点 的 所 有 骨骼 的 最 终 变 换 。 





23.7 练习 


1. 亲手 建立 一 个 可 以 运动 的 线性 层次 结构 模型 并 对 它 进行 泻 染 。 
例如 ， 可 以 用 球体 网 格 与 圆柱 体 网 格 构建 出 一 个 简单 的 机 器 手臂 模型 : 
以 球体 模拟 关节 ， 把 圆柱 体 作为 臂膀 。 


2. 杀 目 创建 一 个 如 图 23.12 所 示 的 可 运动 树 状 层次 结构 模型 ， 并 对 
它 进 行 泻 染 。 同 时 ， 也 可 以 像 练习 1 中 那样 ， 再 次 使 用 球体 与 圆柱 体 进 
行 建 模 。 





| 


ANSodY 


图 23.12 一 种 简单 的 树 状 网 格 层 次 结构 


3. 如 果 读 者 手 里 有 动画 设计 包 〈Blender 是 免费 的 ) ， 就 可 以 尝试 
学 习 如 何 利用 骨骼 及 其 混合 权 值 (blend weight) 来 建立 一 个 简单 的 动画 
角色 模型 。 随 后 ， 将 生成 的 动画 模型 数据 导出 为 文 持 顶点 混合 的 .x 格 式 
文件 ， 再 试 着 把 该 文件 数据 转换 为 .m3d 格 式 ， 以 便 在 “Skinned 
Mesh”《〈 蒙 皮 网 格 ) 演示 程序 中 对 该 模型 进行 泻 染 。 当 然 ， 这 并 不 是 一 
个 短期 内 就 能 完成 的 项 目 。 











[1] 原文 为 frame hierarchies， 多 译 为 “框架 层次 ”。 但 译 者 认为 翻译 
为 “ 标 架 层次 ”也 可 行 ， 甚 至 更 妥 ， 原 因 见 下 文 。 








[2] 有 的 文献 中 也 把 构成 层次 结构 中 的 元 素 称 为 节点 或 子 物体 。 
[3] 下 文 简 记 作 父 坐标 系 ， 类 似 的 还 有 子 坐 标 系 、 根 坐标 系 等 。 
[4] 这 里 给 出 的 都 是 示例 数据 ， 因 此 会 与 真正 的 源码 有 部 分 出 入 。 


[5] DirectX 12 还 有 一 些 新 的 特性 ， 本 书 并 没有 提 到 ， 比 如 “多 GPU 引 擎 
以 及 多 GPU 适配器 的 使 用 与 同步 ”(dn933254， 后 者 提 及 得 较 少 ) 。 有 
关 的 官方 示例 为 D3D12LinkedGpus 与 D3D12HeterogeneousMultiadapter。 
至 于 多 线程 方面 ， 作 者 认为 是 高 级 话题 ， 只 是 晴 贤 点 水 ， 也 提 到 了 要 参 
考 人 微软 提供 的 D3D12Multithreading 示 例 。 事 实 上 ， 多 线程 的 有 关 函 数 本 
书 基 本 都 有 涉及 ， 关 键 在 于 实际 应 用 上 的 绘制 调度 策略 。 有 的 读者 可 能 
希望 了 解 DirectX 11 程 序 在 Windows 10 上 运行 的 方法 。 官 网 上 有 文 专 解 
移植 问题 《Porting from Direct3D 11 to Direct3D 12》 (mt431709) 。 如 
果 对 程序 执行 效率 的 要 求 不 太 高 ， 还 可 以 从 Direct3D 11on12 这 组 API 入 
手 进 行 移 植 ， 有 关 的 官方 示例 为 D3D12110n12。 本 书 作 者 在 自己 的 官网 
d3dcoder 上 也 给 出 了 前 一 版 DirectX 11 程 序 在 此 环境 中 运行 的 方法 
《Direct3D 11 Book Demos with Windows 10 and Visual Studio 2015》 。 
有 网 友 提 出 例 程 在 切换 全 屏 模 式 时 可 能 会 月 涡 ， 但 他 没 说 明 环 境 。 为 保 
俏 起 见 ， 在 此 给 出 微软 的 相关 示例 D3D12Fullscreen。 微 软 还 推出 了 
DirectX Raytracing (DXR) 借 此 实现 光线 追踪 〈 可 见 《Announcing 
Microsoft DirectX Raytracing!》 ) ; 并 设计 以 WinML 与 DirectML 在 游戏 











方面 辅 以 机 器 学 习 (参见 《Gaming with Windows ML》 ) 。 前 文 也 提 到 
过 ， 随 着 Windows 10 重 要 版 本 的 更 新 ，DirectX 12 可 能 也 会 增加 一 些 新 
特性 ， 这 可 以 参考 New Releases (mt748631) 。beyond3d 论 坛 还 有 一 个 
帖子 《Direct3D feature levels discussion》， 讨 论 是 Direct3D 11 与 
Direct3D 12 每 次 升级 的 特性 ， 并 且 还 在 持续 更 新 中 。 对 于 初学 者 而 言 ， 
找到 否 海 明灯 进步 似乎 会 比较 快 。 有 两 篇 此 书 前 版 的 书评 比较 好 ， 分 别 
名 为 《我 还 是 愿意 章 它 为 龙 书 》 与 《 龙 书 得 失 : 请 读 DirectX 9.0c A 
Shader Approach 版》。 两 文中 都 提 到 的 Clayman 的 《游戏 程序 员 养 成 计 
划 》 也 推荐 读 一 恋 。 新 兴 论 坛 的 崛起 也 亮 出 一 批 此 方面 的 个 中 高 手 ， 比 
如 Milo Yip、 叛 逆 者 以 及 空 明 流 转 等 〈 不 分 多 后 且 并 不 完整 ) 。Milo 
Yip 也 曾 列 过 一 个 与 图 形 学 学 习 有 关 的 roadmap， 名 为 《游戏 程序 员 的 学 
习 之 路 《〈 中 英文 两 版 ) 》《 额 ， 有 网 友 美 其 名 日 : 游戏 程序 员 的 劝 退 之 
路 。 换 句 话 说， 最 重要 的 是 您 要 做 什么 ? 希望 达到 何 种 程度 ? ) 。 另 
外 ， 微 软 GitHub 上 的 示例 (DirectX-Graphics-Samples) 一 定 要 刷 一 遍 。 
在 提出 与 Direct3D 12 相 关 的 问题 时 ， 最 好 说 明 上 自己 所 用 的 具体 环境 ， 比 
如 显卡 型 号 、 具 体系 统 版 本 等 ， 有 时 问题 还 可 能 与 驱动 有 关 ! 另外 ， 本 
书 在 GitHub 上 的 代码 更 新 细节 以 及 网 友 的 讨论 最 好 也 看 一 看 ， 例 如 有 网 
友 提 到 本 书 例 程 的 性 能 还 有 利用 其 他 参数 来 提升 的 空间 等 。 
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附录 A Windows 编 程 入 门 





为 了 使 用 Direct3D 应 用 程序 编程 接口 (Application Programming 
Interface，API) ， 我 们 先 要 创建 出 含有 一 个 主 窗口 的 Windows 应 用 程 
序 ， 并 在 此 窗口 中 泻 染 3D 场 景 。 本 附录 的 目标 就 是 向 读者 介绍 如 何 利 
用 原生 Win32 API 来 编写 Windows 应 用 程序 。 简 单 来 计 ，Win32 API 是 一 
套 暴 露 给 用 户 的 底层 函数 与 结构 体 ， 我 们 通过 C 语 言 调 用 它 即 可 创建 
Windows 应 用 程序 。 例 如 ， 要 定义 一 个 窗口 类 ， 我 们 就 要 填写 Win32 
API 中 的 WNDCLASS 结 构 体 实例 ; 要 创建 一 个 窗口 ， 就 要 调用 Win32 API 
的 CreatewWindow 函 数 ， 要 通知 Windows 系 统 呈 现 一 个 特定 的 窗口 ， 就 
要 使 用 Win32 API 中 的 ShowWindow 函 数 。 














Windows 编 程 是 一 门 内 容 庞杂 的 主题 ， 本 附录 仅 介 绍 与 我 们 所 用 的 
Direct3D 紧 密 相 关 的 部 分 知识 。 对 以 Win32 API 编 写 Windows 程 序 感 兴趣 
读者 ， 我 们 同 您 推荐 查尔斯 - 佩 措 尔 德 (Charles Petzold) 所 车 的 
Programming Windows ( 《Windows 程 序 设 计 》) 一 书 ， 目 前 ， 此 书 的 
最 新 版 本 为 第 5 版 出 ， 它 是 此 领域 的 参考 标 配 。 另 一 件 无 价 之 宝 就 是 涵 
盖 了 所 有 微软 技术 的 MSDN 库 ， 它 通常 被 宫 括 在 微软 的 Visual Studio 之 
中 ， 但 也 可 以 在 线 阅 读 。 一 般 来 说 ， 如 果 我 们 偶尔 过 到 了 一 个 比较 陌生 
的 Win32 函 数 或 结构 体 并 希望 对 此 了 解 得 更 多 ， 就 可 以 登录 MSDN 并 搜 
索 与 该 函数 或 结构 体 相关 的 所 有 信息 。 如 果 有 读者 感觉 本 附录 中 所 谈 及 
的 某 个 Win32 函 数 或 结构 体 讨论 得 并 不 太 深入 ， 便 可 前 往 MSDN 查 看 相 

















天 的 文档 。 
学 习 目 标 : 
1. 学 习 并 理解 Windows 编 程 中 和 常用 到 的 事件 驱动 编程 模型 。 


2. 学 习 为 使 用 Direct3D 而 创建 Windows 应 用 程序 所 需 的 最 简 代码 。 


注 意 Note 


为 避免 混 涌 ， 我 们 将 使 用 大 写字 母 “w” 开 头 的 Windows 来 表示 视窗 
操作 系统 ， 而 以 小 写字 母 *“w”" 作 为 开头 的 window 来 代表 Windows 系 统 中 
的 特定 窗口 。 


A.1 概述 











顾名思义 ，Windows 编 程 的 主题 之 一 就 是 编写 窗口 程序 。Windows 
应 用 程序 由 许多 组 件 构成 ， 如 应 用 程序 的 主 窗口 、 沫 单 、 工 具 栏 、 滚 动 
条 、 投 钮 以 及 其 他 的 对 话 框 控件 。 因 此 ， 一 个 Windows 应 用 程序 往往 是 
由 若干 窗口 构成 的 。 后 续 小 节 会 为 Windows 编 程 的 诸多 概念 陆续 给 出 简 
明 的 概述 ， 在 更 全 面 的 讨论 开始 之 前 ， 这 些 知识 应 当 是 我 们 所 熟知 的 。 





A.1.1 资源 


在 Windows 系 统 中 ， 多 款 应 用 程序 可 以 并 发 运行 。 因 此 ， 像 CPU、 
内 存 力 全 显示 器 屏幕 这 些 人 硬件 资源 ， 都 在 多 应 用 程序 的 共享 范围 之 列 。 
为 了 防止 多 应 用 程序 在 无 组 织 、 无 纪律 的 情况 下 访问 或 修改 资源 所 引发 
的 混乱 ，Windows 应 用 程序 并 不 能 直接 访问 硬件。Windows 系 统 的 主要 
任务 之 一 就 是 管理 当前 正在 运行 中 的 实例 化 程序 并 为 它们 合理 分 配 资 
源 。 因 此 ， 为 避免 我 们 编写 的 程序 因 菏 些 操作 而 对 其 他 运行 中 的 应 用 产 
生 不 必要 的 影响 ， 这 些 具 体 的 执行 过 程 都 要 交 由 Windows 系 统 来 加 以 处 
理 。 例 如 ， 要 展示 一 个 窗口 ， 我 们 必须 调用 Win32 API 函 
数 ShowNindow， 而 不 能 直接 向 显存 中 写 入 数据 。 














A.1.2 事件、 消息 队列 、 消 息 以 及 消息 循环 


凡是 windows 应 用 程序 就 要 依从 事件 驱动 编程 模型 〈event-driven 


programming model) 。 一 般 来 讲 ， 应 用 程序 总 会 “坐等 ”2] 某 事 的 发 生 ， 

即 事 件 〈event) 的 发 生 。 生 成 事件 的 方式 多 种 多 样 ， 第 见 的 例子 有 键 

盘 按键 、 点 击 鼠 标 ， 或 者 是 窗口 的 创建 、 调 整 大 小 、 移 动 、 关 财 、 最 小 
化 、 最 大 化 乃至 “隐身 〈visible， 即 窗口 变 为 不 可 见 的 状态 ) ” 








当 事 件 发 生 时 ，Windows 会 回 发 生 事件 的 应 用 程序 发 送 相应 的 消 县 
(message) ， 随 后 ， 该 消息 会 被 添加 至 此 应 用 程序 的 消 且 队列 
(message queue， 简 言 之 ， 这 是 一 种 为 应 用 程序 存储 消息 的 优先 级 队 
列 ) 之 中 。 应 用 程序 会 在 消息 循环 (message loop) 中 不 断 地 检测 队列 
中 的 消息 ， 在 接收 到 消息 之 后 ， 它 会 将 此 消息 分 派 到 相应 窗口 的 窗口 过 
程 (window procedure) 。 “一 个 应 用 程序 可 能 附 有 若干 个 窗口 。) 
个 窗口 都 有 一 个 与 之 关联 的 名 为 窗口 过 程 的 函数 由。 我 们 实现 的 窗口 过 
程 函数 中 写 有 处 理 特定 消息 的 代码 。 比 如 说 ， 我 们 可 能 会 希望 在 按 下 
Esc 键 之 后 销毁 窗口 ， 此 功能 在 窗口 过 程 中 可 写作 : 








case WM KEYDOWN: 
if( wParam == VK_ESCAPE ) 


DestroyWindow(ghMainWnd); 
return 0; 





我 们 应 将 目标 窗口 不 处 理 的 消息 转发 至 Win32 API 所 提供 的 默认 窗 
口 过 程 DefNindowProc， 让 它 去 完成 相应 处 理 。 


简 而 言 之 ， 用 户 或 应 用 程序 的 茶 些 行为 会 产生 事件 。 操 作 系 统 会 为 
啊 应 此 事件 的 应 用 程序 发 送 相 关 的 消息 。 随 后 ， 该 消息 会 被 添加 到 目标 
应 用 程序 的 消息 队列 之 中 。 由 于 应 用 程序 会 不 断 地 检测 队列 中 的 消 妃 ， 
在 接收 到 消 奶 后 ， 应 用 程序 就 会 将 它 分 派 到 对 应 窗口 的 窗口 过 程 。 最 





后 ， 窗 口 过 程 会 针对 此 消息 执行 相应 的 系列 指令 。 
图 A.1 相 对 完整 地 概括 了 事件 驱动 编程 的 模型 。 


在 消息 被 应 用 程序 处 理 之 Windows 统 会 让 
前 ， 消 息 队列 会 一 直 保管 we 


| a 出 事件 的 发 生 。 如 有 事件 
它们 。 因 此 ， 考 应 用 程序 发 生 ，Windows 会 将 相关 
正 忙于 其 他 事务 ， 消 息 队 


消息 发 送 至 响应 此 消息 的 
列 便 可 符 它 在 这 段 时 间 内 事件 人 
保存 未 被 处 理 的 消息 。 另 


外 ， 优 先 级 高 的 消息 会 先 
于 优先 级 低 的 消息 得 到 处 
理 。 





< 
过 
国 
下 
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的 消息 队列 
的 消息 队列 
的 消息 队列 


应 用 程序 C 


a] 
性 
国 
耳 
| 


窗口 应 用 程序 A 应 用 程序 B 立 用 程序 C 
过 程 Al 的 消息 循环 的 消息 循环 1 





应 用 程序 的 消息 循环 会 不 窗口 窗口 窗口 
间断 地 检测 消息 队列 中 的 过 程 B1 过 程 CL 过 程 C2 
消息 。 在 “获取 ”了 一 个 


至 目标 窗口 的 窗口 过 程 。 





窗口 过 程 是 一 种 由 应 用 程序 开发 

人 员 定 义 的 函数 。 窗 口 在 收 到 分 

派 来 的 消息 后 会 自动 调用 此 函数 。 
注意 ， 一 个 单独 的 应 用 程序 可 能 

case WM_CREATE: 会 有 多 个 谷口 过 程 。 

# 处 理 创建 窗口 消息 

case WM KEYDOWN 

7 处 理 键盘 按键 消息 我 们 在 窗口 过 程 函数 中 编写 的 

六 代码 是 希望 针对 应 用 程序 中 目标 
! 处 理 销毁 敌 口 消息 窗口 发 生 的 特定 事件 而 执行 。 在 
此 示例 中 ， 我 们 展示 的 是 针对 创 
建 窗口 、 键 盘 按 键 以 及 销毁 窗口 
这 3 种 消息 句柄 的 处 理 过 程 。 








图 A.1 编写 Windows 应 用 程序 所 用 的 事件 驱动 编程 模型 





A.1.3 图 形 用 户 界 面 


大 多 数 的 Windows 程 序 会 以 图 形 用 户 界 面 (Graphical User 


Interface，GUI) 的 表现 形式 呈现 在 用 户 面 前 并 供 其 使 用 。 上 典型 的 
Windows 应 用 程序 应 具有 一 个 主 窗口 、 一 个 菜单 栏 、 一 个 工具 栏 ， 当 


然 ， 或 许 还 会 有 一 些 其 他 类 型 的 控件 。 图 A.2 所 示 的 是 一 些 常见 的 GUI 


元 素 。 对 于 Direct3D 游 戏 编程 来 说 ， 我 们 往往 用 不 到 过 于 复杂 的 GUI。 
事实 上 ， 在 大 多 数 情况 下 仅 需 一 个 主 窗口 即 可 ， 我 们 只 是 用 它 的 工作 区 
来 演 染 3D 场 景 而 已 。 
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图 A.2 





典型 的 windows 应 用 程序 GUI。 此 程序 中 最 大 的 白色 算 形 范围 即 为 工作 区 。 一 般 来 讲 ， 
这 块 区 域 即 为 大 多 数 程序 向 用 户 展示 输出 内 容 的 地 方 。 在 编写 Direct3D 应 用 程序 的 时 候 ， 我 们 
就 会 将 3D 场 景 泻 染 到 窗口 的 工作 区 中 






































A.1.4 Unicode 


Unicode 标 准 以 16 位 值 来 表示 一 个 字符 。 这 样 一 来 ， 我 们 束 能 通过 
它 庞 大 的 字符 集 来 表示 国际 字符 以 及 一 些 其 他 的 符 写 。C++ 语 言 中 以 


wchar tt 类 型 的 宽 字符 (wide-character) 来 表示 Unicode 码 。 不 论 是 在 


32 位 还 是 64 位 的 Windows 操 作 系 统 中 ，wchar_t 都 是 16 位 的 字符 类 型 。 
在 使 用 宽 字 符 时 ， 我 们 必须 为 字符 串 字 面值 (string literal) 冠 以 大 写字 
母 前 缀 站 ， 例 如 ; 


前 绥 工 会 令 编译 器 将 字符 串 字 面值 作为 宽 字 符 串 进行 处 理 《〈 即 把 
char 蔡 换 为 wchar_ tt) 。 还 有 一 个 需要 重视 的 问题 是 ， 我 们 在 处 理 宽 字 
符 时 还 需 使 用 相应 版 本 的 字符 串 函 数 。 例 如 ， 在 获取 宽 字 符 串 的 长 度 
时 ， 应 使 用 wcslen 函 数 而 非 strlen 函 数 ， 在 复制 宽 字符 串 时 ， 应 以 
wcscpy 冰 数 代 蔡 strcpy 观 数 ; 在 比较 两 个 宽 字 符 串 时 ， 该 使 用 wcscmp 
函数 而 不 是 函数 strcmp。 这 些 宽 字 符 厂 本 的 函数 使 用 的 也 并 不 是 char 
类 型 的 指针 ， 而 是 wchar_t 类 型 的 指针 。 不 仅 如 此 ，C++ 标 准 库 还 专门 
提供 了 宽 字 符 版 本 的 字符 串 类 std: :wstring 中 。Windows 头 文件 
WinNT.h 中 亦 有 如 下 定义 : 

















typedef wchar_t WCHAR; // wc，16 位 的 UNICODE 字 符 


A.2 基本 的 Windows 应 用 程序 


以 下 代码 描述 的 是 一 个 麻 答 虽 小 却 五 脏 俱全 的 Windows 程 序 。 尺 管 
在 下 一 节 中 我 们 才 会 开始 对 这 些 代码 进行 讲解 ， 但 在 此 之 前 ， 读 者 最 好 
先 尽 最 大 的 努力 按照 给 出 的 注释 自行 查阅 一 衣 。 男 外 ， 也 建议 您 像 对 答 
习题 那样 ， 用 开发 工具 创建 一 个 工程 ， 亲 上 自 输入 这 些 代 码 ， 编 译 并 执 
行 。 需 要 注意 的 是 ， 我 们 在 使 用 Visual C++ 开发 与 Direct3D 有 关 的 程序 
时 ， 创 建 的 必须 是 “Win32 项 目 ”(Win32 application project) ， 而 
非 “Win32 控 制 台 应 用 程序 ”(Win32 console application project) 。 








// Win32Basic.cpp 的 作者 为 Frank Luna (C) 2668 版 权 所 有 





// 
// 详 述 Direct3D 编程 所 需 的 Nin32 最 简 代 码 















































// 包含 windows 头 文件 ， 其 中 含有 编写 Nindows 应 用 程序 所 需 的 所 有 Win32 API 结 构 体 、 数 
据 类 型 以 及 
// 函数 的 声明 


#include <windows.h> 





























// 用 于 指认 所 创建 主 窗口 的 句柄 
HWND ghMainwnd = 6; 








// 封装 初始 化 Windows 应 用 程序 所 需 的 代码 。 如 果 初 始 化 成 功 ， 该 函数 返回 true， 否 则 返回 
false 
bool InitwindowsApp(HINSTANCE instanceHandle, int show); 








// 封装 消息 循环 代码 
int Run(); 

















// 窗口 过 程 会 处 理 窗口 所 接收 到 的 消息 
LRESULT CALLBACK 
WndProc(HWND hWnd, UINT msg, WPARAM wParam, LPARAM lParam); 

















// 在 Windows 应 用 程序 中 WinMain 消 数 就 相当 于 大 多 数 语 言 中 的 main() 逊 数 
int WINAPI 





WinMain(HINSTANCE hInstance，HINSTANCE hpPrevInstance， 
PSTR pCmdLine, int nCmdShow) 























{ 

// 首先 将 hInstance 和 nShowCmd 作为 参数 来 调用 封装 函数 (InitWindowsApp)， 
用 以 创建 和 初始 

// 化 应 用 程序 的 主 窗口 






































if(!InitwindowsApp(hInstance, nShowCmd)) 
return 0; 





// 一 旦 将 创建 好 的 应 用 程序 初始 化 完毕 后 ， 我 们 就 可 以 开启 消息 循环 了 。 随 后 ， 消 息 循 
环 就 会 持续 运转 ， 
// 直至 接收 到 消息 NM_QUIT 一 这 表示 此 应 用 程序 被 关闭 ， 该 终止 运行 了 


return Run(); 























} 


bool InitwindowsApp(HINSTANCE instanceHandle, int show) 
{ 

















// 第 一 项 任务 便 是 通过 填写 WNDCLASS 结 构 体 ， 并 根据 其 中 描述 的 特征 来 创建 一 个 窗口 
WNDCLASS wc; 



































wc.style = CS HREDRAW | CS_VREDRAW ; 
wc.lpfnwndProc = WndProc; 


wc.cbClsExtra = 0; 

wc.cbWndExtra = 0; 

wc.hInstance = instanceHandle; 

wc.hIcon = LoadIcon(6@, IDI APPLICATION); 


wc.hCursor = LoadCursor(6@, IDC ARROW); 
wc.hbrBackground = (HBRUSH)GetStockObject(WHITE_BRUSH); 
wc.lpszMenuName = 0@; 

wc.lpszClassName = L"BasicWndClass"; 


// 下 一 步 ， 我 们 要 在 Windows 系 统 中 为 上 述 WNDCLASS 注 册 一 个 实例 ， 这 样 一 来 ， 即 可 
据 此 创建 窗口 
if(!RegisterClass(&wc)) 














{ 
MessageBox(0, L"RegisterClass FAILED", 06, ©); 
return false; 
} 
// 注册 过 WNDCLASS 实 例 之 后 ， 我 们 就 能 用 CreateWindow 函 数 来 创建 一 个 窗口 了 。 此 函 
数 返 回 的 就 








// 是 所 建 窗口 的 句柄 〈 一 个 HNND 类 型 的 数值 ) 。 如 果 创 建 失败 ， 返 回 的 句柄 数值 为 8。 
窗口 句柄 是 一 种 
// 窗口 的 引用 方式 ， Windows 系 统 会 在 内 部 对 此 进行 管理 。 处 理 窗口 的 大 量 Win32 AP 
I 函 数 都 需要 
// 把 HWND 类 型 作为 参数 ， 以 此 来 确定 要 对 哪 一 个 窗口 执行 相应 的 操作 



















































































ghMainwnd = CreateWindow( 

L"BasicwndCclass"，// 创建 此 窗口 采用 的 是 前 面 注 册 的 WNDCLASS 实 例 
L"Win32Basic",， // 窗口 标题 
WS_OVERLAPPEDWINDOW，// 窗口 的 样式 标志 
CW_USEDEFAULT， // x 坐标 
CW_USEDEFAULT， // y 坐 标 
CW_USEDEFAULT， // 窗口 宽 
CW_USEDEFAULT， // 窗口 高 
6， // 父 窗口 
6， // 荣 单 句柄 

instanceHandle， // 应 用 程序 实例 句柄 

0); // 可 在 此 设置 一 些 创 建 窗口 所 用 的 其 他 参数 
































洱 沽 




















if(ghMainwnd == 0) 

{ 
MessageBox(0, L"CreateWindow FAILED", 06, 0); 
return false; 


} 











// 尽管 窗口 已 经 创建 完毕 ， 但 仍 没 有 显示 出 来 。 因 此 ， 最 后 一 步 便 是 调用 下 面 的 两 个 函 
数 ， 将 刚刚 创建 

// 的 窗口 展示 出 来 并 对 它 进行 更 新 。 可 以 看 出 ， 我 们 为 这 两 个 函数 都 传 入 了 窗口 句柄 ， 
这 样 一 来 ， 它 们 

// 就 知道 需要 展示 以 及 更 新 的 窗口 是 哪 一 个 

ShowWindow(ghMainWnd, show); 

UpdateWindow(ghMainWnd); 


















































return true; 


} 


int Run() 


{ 
MSG msg = {06}; 








// 在 获取 NM_QUIT 消 息 之 前 ， 该 函数 会 一 直 保 持 循 环 。GetMessage 函 数 只 有 在 收 到 W 
M_QUIT 消 

// 妃 时 才 会 返回 9 〈false) ， 这 会 造成 循环 终止 ， 而 知 发 生 错误 ， 它 便 会 返回 -1。 
还 需 注 意 的 一 点 

// 是 ， 在 未 有 信息 到 来 之 时 ，GetMessage 函 数 会 令 此 应 用 程序 线程 进入 休眠 状态 

BOOL bRet = 1; 

while( (bRet = GetMessage(&msg, 6, 060, 60)) != 6 ) 

{ 





















































if(bRet == -1) 

{ 
MessageBox(60, L"GetMessage FAILED", L"Error", MB_OK); 
break; 


else 
{ 
TranslateMessage(&msg); 
DispatchMessage(&msg); 
} 


return (int)msg.wParam; 


} 


LRESULT CALLBACK 
WndProc(HWND hwnd，UINT msg, WPARAM wParam, LPARAM lParam) 


{ 
































// 处 理 一 些 特定 的 消息 。 注 意 ， 在 处 理 完 一 个 消息 之 后 ， 我 们 应 当 返 回 6 
Switch( msg ) 

















// 在 按 下 鼠标 左 键 后 ， 弹 出 一 个 消息 杠 
case WM LBUTTONDOWN: 

MessageBox(60, L"Hello, World", L"Hello", MB_OK); 

return 0; 











// 在 按 下 Esc 键 后 ， 销 毁 应 用 程序 的 主 窗口 
case WM KEYDONWN : 
if( wParam == VK_ESCAPE ) 
DestroyWindow(ghMainWnd); 
return 0©; 




















// 处 理 销毁 消息 的 方法 是 发 送 退 出 消息 ， 这 样 一 来 便 会 终止 消息 循环 
case WM DESTROY: 










































































PostQuitMessage(0); 
return 0) 
} 
// 将 上 面 没有 处 理 的 消息 转发 给 默认 的 窗口 过 程 。 注 意 ， 我 们 上 自己 所 编写 的 窗口 过 程 一 
定 要 返回 














// DefWNindowProc 函 数 的 返回 值 
return DefWindowProc(hWnd, msg, wParam, lParam); 


} 





上 述 程序 的 执行 效果 如 图 A.3 所 示 。 




















图 A.3 ”上 述 程序 的 执行 效果 。 图 中 演示 的 是 当 用 户 在 窗口 工作 区 按 下 鼠标 左 键 时 弹出 的 消息 
框 。 读 者 可 以 试 一 试 按 下 Esc 键 ， 看 看 会 发 生 什么 


A.3 讲解 基本 Windows 应 用 程序 的 工作 流程 


下 面 将 对 以 上 代码 从 头 至 尾 考察 一 番 ， 并 根据 调用 的 顺序 逐步 深入 
所 用 的 一 切 函 数 。 在 阅读 后 续 小 节 时 ， 应 对 照 上 一 市 “基本 的 Windows 
应 用 程序 ”中 所 列 的 代码 进行 学 习 。 





A.3.1 程序 中 的 头 文件 、 全 局 变量 以 及 函数 声明 


我 们 在 程序 中 要 做 的 第 一 件 事 承 是 包含 windows.h 头 文件 。 这 样 一 
来 ， 我 们 束 能 够 使 用 在 windows.h 文 件 中 定义 的 各 种 结构 体 、 数 据 类 型 
以 及 函数 声明 这 些 Win32 API 编 程 所 需 的 基本 元 素 。 


#include “windows .h> 


第 二 条 语句 是 一 个 HWND 类 型 的 全 局 变量 实例 ， 它 表示 “ 某 个 窗口 
的 句柄 ”。 在 Windows 编 程 中 ， 我 们 通 弟 采用 Windows 系 统 在 内 部 为 每 个 
对 象 维 护 的 句柄 来 处 理 相应 的 对 象 。 在 这 个 示例 中 ， 我 们 使 用 的 就 是 
Windows 系 统 为 应 用 程序 主 窗口 维护 的 HNND 句 柄 。 保 留 该 窗口 句柄 的 原 
因 是 ， 有 许多 API 需 要 针对 特定 窗口 进行 处 理 ， 因 此 参数 中 也 就 少不了 
窗口 句柄 的 身影 ， 它 们 会 据 此 对 相应 的 窗口 执行 函数 的 功能 。 例 如 ， 在 
调用 UpdateWindow 时 就 需要 传 入 HWND 类 型 的 参数 ， 该 函数 会 对 此 句柄 
所 引用 的 窗口 进行 更 新 。 如 果 我 们 不 同 UpdateNindow 函 数 传 入 句柄 ， 
它 就 无 法 知道 要 更 新 的 窗口 是 哪 一 个 。 


HWND ghMainwnd = 6; 


























接 下 来 的 3 行 代码 都 是 函数 声明 。 简 言 之 ，InitNindowsApp 函 数 创 
建 并 初始 化 应 用 程序 的 主 窗口 ，Run 函 数 封装 了 应 用 程序 的 消息 循 
环 ，WndProc 函 数 则 是 主 窗口 的 窗口 过 程 。 我 们 会 在 调用 这 些 函 数 的 地 
方 对 它们 的 具体 细节 展开 讨论 。 





bool InitwindowsApp(HINSTANCE instanceHandle, int show); 
int Run(); 


LRESULT CALLBACK 
WndProc(HWND hWnd, UINT msg, WPARAM wParam, LPARAM lParam); 





A.3.2 WinMain 


Windows 编 程 中 所 用 的 NinMain 函 数 束 相当 于 在 C++ 编程 时 通 稼 用 
到 的 main 函 数 。WinMain 的 原型 如 下 。 
int WINAPI 


WinMain(HINSTANCE hInstance，HINSTANCE hpPrevInstance， 
PSTR pCmdLine, int nCmdShow) 





1. hInstance: 当前 应 用 程序 的 实例 句柄 。 这 是 一 种 识别 与 引用 
CO 前 面 曾 提 到 多 个 Windows 应 用 程序 并 发 运行 的 情 
况 ， 此 时 ， 通 过 句柄 就 可 以 便捷 地 引用 所 需 的 应 用 程序 。 


2. hPrevInstance: Win32 编 程 用 不 到 此 参数 ， 将 其 值 设 为 0。 


3. pCmdLine: 运行 此 程序 所 用 的 命令 行 参数 字符 串 。 





4. nCmdShow: 此 参数 指定 了 应 用 程序 该 如 何 显示 。 显 示 窗 口 的 币 








用 命令 有 按 窗 口 当前 的 大 小 与 位 置 显示 出 来 (SN_SHON) 、 窗 口 最 大 化 
CSW_SHOWMAXIMIZED) 以 及 窗口 最 小 化 〈SW_SHOWNMINIMIZED) 。 对 
于 窗口 显示 命令 的 完整 列表 可 参见 MSDN 库 。 


如 果 WinMain 函 数 成 功 运行 ， 那 么 在 其 终止 时 ， 它 应 当 返 回 
NM_QUIT 消 息 的 wParam 成 员 〈 即 退出 值 ) 。 如 果 函 数 在 退出 时 还 未 进入 
消息 循环 ， 那 么 它 应 该 返回 0。WINAPI 标 识 符 的 定义 为 : 


它 指 明了 函数 的 调用 约定 ， 关 乎 函数 参数 的 入 栈 顺序 等 。 


A.3.3 WNDCLASS 结 构 体 与 实例 注册 


在 WinMain 中 我 们 调用 了 函数 InitwindowsApp， 借 此 完成 了 我 们 
程序 押 需 的 所 有 初始 化 任务 。 现 在 我 们 来 好 好 研究 一 下 它 的 具体 实 
现 。InitwindowsApp 函 数 返 回 的 是 一 个 布尔 值 ， 如 果 返 回 true 则 初始 
化 成 功 ， 返 回 false 则 表示 失败 。 在 NinMain 函 数 的 实现 中 ， 我 们 将 应 
用 程序 实例 的 副本 以 及 窗口 的 显示 命令 变量 都 以 参数 的 形式 传 入 了 
InitWwindowsApp 了 函数， 这 两 种 数据 都 可 从 函数 WinMain 的 参数 列表 中 
获取 。 


if(!InitwindowsApp(hInstance, nCmdShow)) 


初始 化 窗口 的 第 一 步 就 是 通过 填写 WNDCLASS (window class， 窗 口 
类 ) 结构 体 来 描述 窗口 的 基本 属性 。 其 定义 如 下 : 








typedef struct WNDCLASS { 
UINT style; 
WNDPROC lpfnwndProc; 
int cbClsExtra; 
int cbWwndExtra; 
HANDLE hInstance; 


HICON hIcon; 

HCURSOR hCursor; 

HBRUSH hbrBackground; 

LPCTSTR lpszMenuName; 

LPCTSTR lpszClassName; 
} WNDCLASS; 





1. style: 指定 了 窗口 类 的 样式 。 示 例 中 使 用 的 是 CS_HREDRAW 
与 CS_VREDRAW 两 种 样式 的 组 合 。 这 两 种 位 标志 表示 当 工 作 区 的 宽度 或 
高 度 发 生 改 变 时 就 重 绘 窗口 。 对 于 各 种 样式 的 完整 描述 可 参考 MSDN 
库 。 


wc.style = CS_HREDRAW | CS_VREDRAW; 


2. lpfnwndProc: 指向 与 此 WNDCLASS 实 例 相 关联 的 窗口 过 程 函 数 
的 指针 。 基 于 此 WNDCLASS 实 例 创 建 的 窗口 都 会 用 到 这 个 窗口 过 程 。 这 
就 是 说 ， 若 要 创建 两 个 采用 同一 窗口 过 程 的 窗口 ， 仅 需 基 于 同一 
个 NNDCLASS 实 例 即 可 。 如 果 和 希望 以 不 同 的 窗口 过 程 创 建 两 个 窗口 ， 则 
需要 为 每 个 窗口 都 填写 一 个 不 同 WNDCLASS 实 例 。 我 们 会 在 A.3.6 节 中 讨 
PE 

















wc.lpfnwndProc = WndProc; 


3. cbClsExtra 与 cbWndExtra: 我 们 可 以 根据 需求 ， 借 助 这 两 个 
字段 来 为 当前 应 用 分 配额 外 的 内 存 空间 。 我 们 现在 编写 的 程序 不 需要 这 
额外 的 空间 ， 因 此 将 它们 统统 设置 为 0。 





wc.cbClsExtra = 0; 
wc.cbWndExtra = 0; 





4. hInstance: 该 字段 是 当前 应 用 实例 的 句柄 。 前 面 兽 提 到 ， 应 
用 程序 实例 的 句柄 最 早 是 通过 NinMain 国 数 传 进来 的 。 





wc.hInstance = instanceHandle; 


5. hIcon: 我 们 可 以 通过 这 个 参数 为 以 此 窗口 类 创建 的 窗口 指定 
一 个 图 标的 句柄 。 当 然 ， 我 们 可 以 使 用 自己 设计 的 图 标 ， 但 系统 中 也 有 
一 些 内 置 的 图 标 供 我 们 选择 ， 有 共 体 细节 可 参见 MSDN 库 。 下 列 语句 采用 
的 是 默认 的 应 用 程序 图 标 : 


wc.hIcon = LoadIcon(8，IDI_APPLICATION ) ; 


6. hCursor: 与 hIcon 相 类 似 ， 我 们 可 以 借 此 指定 在 光标 略 过 窗口 
工作 区 时 所 呈现 的 样式 的 句柄 。 同 样 ， 系 统 内 置 的 光标 资源 也 不 少 ， 详 
见 MSDN 库 。 下 述 代 码 采 用 的 是 标准 的 “箭头 ”光标 。 


wc.hCursor = LoadCursor(60, IDC ARROW); 


7. hbrBackground: 该 字段 用 来 指出 画 刷 (brush〉 的 句柄 ， 以 此 
旨 定 了 窗口 工作 区 的 背景 颜色 。 在 此 示例 代码 中 ， 我 们 通过 调用 Win32 
函数 GetStockObJject 返 回 了 一 个 内 置 的 白色 画 刷 句柄 。 至 于 其 他 内 置 
的 画 刷 类 型 ， 可 参考 MSDN 库 。 


wc.hbrBackground = (HBRUSH)GetStockObject(WHITE_BRUSH); 


8. lpszMenuName: 指定 窗口 的 菜单 。 由 于 应 用 程序 中 没有 沫 单 ， 


所 以 将 它 设 为 0。 
9. lpszClassName: 指定 所 创 窗 口 类 结构 体 的 名 字 。 这 个 我 们 可 


以 随意 填写 ， 我 们 在 本 示例 中 将 它 命名 为 “BasicWndClass”。 有 了 这 个 
名 字 ， 我 们 就 可 以 在 后 续 需 要 此 窗口 类 结构 体 的 时 候 方 便 地 引用 它 。 


wc.lpszClassName = L"BasicWndClass"; 


填写 好 一 个 WNDCLASS 实 例 之 后 ， 为 了 使 我 们 能 够 基于 它 来 创建 窗 
口 还 需要 将 它 注册 到 Windows 系 统 。 通 过 RegisterClass 函 数 就 可 实现 
这 一 点 ， 它 以 指向 欲 注 册 的 WNDCLASS 结 构 体 的 指针 作为 参数 ， 若 注册 
失败 则 返回 0。 


if(!RegisterClass(&wc)) 
{ 


MessageBox(0, L"RegisterClass FAILED", 606, 0); 
return false; 





A.3.4 创建 并 显示 窗口 


在 将 一 个 WNDCLASS 实 例 注册 给 Windows 系 统 之 后 ， 我 们 就 可 以 根 
据 这 个 窗口 类 的 描述 来 创建 窗口 了 。 通 过 我 们 赋予 己 注册 WNDCLASS 实 
例 的 名 称 (lpszClassName) 便 能 对 它 进 行 引 用 。 我 们 现在 利 
用 CreateWindow 函 数 来 创建 窗口 ， 下 面 是 它 的 详细 描述 。 


HWND CreateWindow( 





LPCTSTR lpClassName, 
LPCTSTR lpWindowName, 
DWORD dwStyle, 

int X， 

int y， 

int nWidth, 

int nHeight, 

HWND hwndParent, 
HMENU hMenu, 

HANDLE hInstance, 
LPVOID lpParam 





1. lpClassName: 存 有 我 们 欲 创建 窗口 的 属性 的 已 注册 NWNDCLASS 
结构 体 的 名 。 








2. lpWindowName: 我 们 给 窗口 起 的 名 称 ， 它 也 将 显示 在 窗口 的 标 


题 栏 中 。 


3. dwStyle: 定义 窗口 的 样式 。WS_OVERLAPPEDWINDOW 是 
由 WS_OVERLAPPED “创建 重 车 窗口 ， 一 般 具 有 标题 栏 和 边 
框 》、WS_CAPTION (具有 一 个 标题 栏 的 窗口 )、WS_SYSMENU 标题 栏 
中 拥有 系统 菜单 的 窗口 ) 、WS_THICKFRAME (使 窗口 具有 可 调整 大 小 的 
边框 ) 、WS_MINIMIZEBOX (具有 最 小 化 按钮 的 窗口 ) 
与 WS_MAXIMIZEBOX (具有 最 大 化 按钮 的 窗口 ) 六 种 标志 组 合 而 成 的 ， 
从 字面 上 就 能 看 出 它们 所 描述 的 窗口 特征 。 窗 口 样式 的 完整 列表 可 参见 
MSDN 库 。 





4. x: 窗口 左上 角 的 初始 位 置 在 于 屏幕 坐标 系 中 的 x 坐标 。 我 们 可 
以 将 此 参数 指定 为 CN_USEDEFAULT， 使 Windows 系 统 自动 选择 一 个 适当 
的 默认 值 。 


5. y: 窗口 左上 角 的 初始 位 置 在 于 屏幕 坐标 系 中 的 y 坐 标 。 我 们 可 
以 将 此 参数 指定 为 CN_USEDEFAULT， 使 Windows 系 统 自动 选择 一 个 适当 
的 默认 值 。 





6. nwidth: 以 像素 为 单位 表示 的 窗口 宽度 。 我 们 可 以 将 其 指定 
为 CN_USEDEFAULT，Windowsx 会 自动 选择 适当 的 默认 值 。 





7. nHeight: 以 像素 为 单位 表示 的 窗口 高 度 。 我 们 可 以 将 其 指定 
为 CW_USEDEFAULT，Windows 会 自动 选择 恰当 的 默认 值 。 


8. hwndParent: 所 建 窗口 的 父 窗口 句柄 。 由 于 我 们 创建 的 窗口 不 
具有 父 窗口 ， 因 此 将 它 设 置 为 0。 

9. hMenu: 荣 单 句柄 。 由 于 我 们 的 程序 无 需 菜 单 ， 因 此 将 它 设 置 
为 0。 

10. hInstance: 与 此 窗口 相关 联 的 应 用 程序 句柄 。 

11. lpParam: 一 个 指向 用 户 定义 数据 的 指针 ， 可 用 作 WM_CREATE 
消息 的 ljpParam 参 数 。 在 CreateWindow 函 数 返 回 之 前 ， 会 向 待 创建 的 
窗口 发 送 NM_CREATE 消 息 。 若 要 在 窗口 新 建 时 执行 某 些 操作 “〈 如 初始 化 
工作 ) ， 则 会 处 理 NM_CREATE 消 息 ， 而 1pParam 参 数 可 传送 处 理 过 程 中 
所 用 的 数据 。 





我 们 指定 的 (z, 幼 坐标 即 窗口 〈 左 上 角 ) 相对 于 屏幕 坐标 系 左上 角 
原点 ) 的 位 置 。 在 屏幕 坐标 系 中 ，z 轴 的 正方 各 依 旧 是 水 平 癌 右 的 方 
问 ， Wc ln be 图 A.4 展 示 的 正 是 这 种 坐标 
系 ， 这 被 称 为 屏幕 坐标 系 或 屏幕 空间 。 














(0， 0) + 六 


臣下 





图 A.4 屏幕 空间 





CreateWindow 函 数 返 回 的 是 它 所 创建 窗口 的 句柄 〈 类 型 
为 HNND) 。 如 采 窗 口 创 建 失败 ， 则 句柄 的 值 为 0《〈 衬 句柄 ) 。 我 们 前 面 
讲 过 ， 句 柄 是 一 种 引用 窗口 的 方式 ， 它 归于 Windows 系 统管 理 。 许 多 
API 的 调用 需要 传 入 HNND， 这 样 才能 使 函数 找 准 要 处 理 的 窗口 。 





ghMainwnd = CreateWindow(L"BasicWndClass", L"Win32Basic", 
WS_OVERLAPPEDWINDOW, 
CW_USEDEFAULT, CW USEDEFAULT, 
CW_USEDEFAULT, CW USEDEFAULT, 
60, 0， instanceHandle, 0); 


if(ghMainwnd == 0) 


MessageBox(0, L"CreateWindow FAILED", 606, 0); 
return false; 


} 





最 后 要 介绍 的 是 在 InitwindowsApp 函 数 中 ， 为 显示 窗口 而 必须 调 
用 的 两 种 函数 。 这 首先 调用 的 是 Showwindow 函 数 ， 我 们 向 它 传递 新 建 





窗口 的 句柄 ， 使 它 知道 要 显示 的 窗口 是 哪 一 个 。 除 此 之 外 ， 还 要 给 它 传 
ws (例如 最 小 化 、 最 大 化 等 ) 的 整数 值 ， 
这 个 值 应 当 是 WinMain 函 数 的 参数 之 一 ， 即 nCmdShow。 展 示 了 窗口 之 
后 ， 我 们 还 应 对 它 刷新 ， 执 行 UpdateWindow 函 数 的 目的 就 在 于 此 ; 
函数 的 参数 是 欲 更 新 窗口 的 句柄 。 


ShowWindow(ghMainwnd，show) ; 
UpdateWindow(ghMainWnd); 


如 果 InitwindowsApp 函 数 运行 到 这 里 ， 那 么 初始 化 工作 就 已 经 大 
功 告 成 ， 我 们 再 返回 s 来 表示 一 切 顺利 。 











A.3.5 消息 循环 





竺 初 始 化 工作 都 完成 之 后 ， 我 们 束 可 以 开始 着 手 程序 的 核心 一 一 消 
息 循 环 。 在 我 们 所 编写 的 基本 Windows 应 用 程序 之 中 ， 消 息 循环 被 封装 
在 一 个 名 为 Run 的 函数 内 。 





int Run() 


MSG msg = {0}; 


BOOL bRet = 1; 
while( (bRet = GetMessage(&msg, 868, 060, 60)) != 6 ) 


if(bRet == -1) 

{ 
MessageBox(60, L"GetMessage FAILED", L"Error", MB_OK); 
break; 

} 

else 

{ 


TranslateMessage(&msg); 


DispatchMessage(&msg) ; 


} 


return (int)msg .wParam; 














Run 函 数 要 做 的 第 一 件 事 束 是 为 表示 Windows 消 恩 的 MSG 类 型 创建 一 
个 名 为 msg 的 变量 实例 。 该 结构 体 的 定义 如 下 。 


typedef struct tagMSG { 
HWND hwnd; 
UINT message,; 
WPARAM wParam; 


LPARAM lParam; 
DWORD time; 
POINT pt; 





1. hwnd: 接收 此 消 奶 的 窗口 过 程 所 属 窗 口 的 句柄 。 


2. message: 用 来 识别 消息 的 预定 义 和 常量 值 (如 NM_QUIT) 。 














3. wParam: 与 此 消息 相关 的 额外 信息 ， 具 体 意义 取决 于 特定 的 消 


并 








4. lParam: 与 此 消 姑 相关 的 额外 信息 ， 其 体 意义 取决 于 特定 的 消 








ls 


5，time: 消息 被 发 出 的 时 间 。 
6. pt: 消息 发 出 时 ， 鼠 标 指针 位 于 屏幕 坐标 系 中 的 坐标 (z, 人 。 


接 下 来 ， 程 序 进入 到 消息 循环 部 分 。GetMessage 函 数 会 从 消 妃 队 


列 中 检索 消息 ， 并 根据 截获 的 消息 细节 填写 msg 的 参数 。 由 于 我 们 不 对 
消息 进行 过 滤 ， 因 此 将 GetMessage 函 数 的 剩余 参数 均 设 为 0。 如 果 
GetMessage 函 数 发 生 错误 ， 它 将 返回 -1。 知 接收 到 NM_QUIT 消 

息 ，GetMessage 函 数 将 返回 0， 继 而 终止 当前 的 消息 循环 。 如 果 
GetMessage 函 数 返 回 其 他 值 ， 那 么 将 继续 执行 下 面 的 
Tec ae ee 

数 。TranslateMessage 函 数 实现 了 键盘 按键 的 转换 ， 特 别 是 将 虚拟 键 
消息 转换 为 字符 消息 ，DispatchMessage 函 数 则 会 把 消息 分 派 给 相应 
的 窗口 过 程 。 


如 果 应 用 程序 根据 NM_QUIT 消 息 顺 利 退出 ， 则 WinMain 函 数 将 返回 
WM_QUIT 消 息 的 参数 wParam〔 即 退出 代码 )〉。 


、 


A.3.6 ”窗口 过 程 





前 文 兽 提 a 到， 我们 在 窗口 过 程 中 编写 的 代码 是 针对 窗口 接收 到 的 消 





因而 进行 相应 的 处 理 。 在 本 章 这 个 基本 的 Windows 应 用 程序 之 中 ， 我 们 
将 窗口 过 程 函 数 命 名 为 NndProc， 它 的 原型 如 下 。 


LRESULT CALLBACK 
WndProc(HWND hWnd, UINT msg, WPARAM wParam, LPARAM lParam); 


函数 将 返回 一 个 LRESULT 类 型 的 值 〈 它 的 定义 是 一 个 整数 ) ， 表 
示 该 函数 调用 是 否 成 功 。CALLBACK 标 识 符 指明 这 是 一 个 回调 
(callback〉 函数 ， 意 味 着 Windows 系 统 会 在 此 程序 的 代码 空间 之 外 调用 





该 函数 。 就 像 我 们 在 这 个 程序 的 源 代 码 中 所 看 到 的 ， 我 们 从 没有 主动 显 
式 地 调用 过 这 个 窗口 过 程 ， 这 是 因为 Windows 系 统 会 在 需要 处 理 消 息 的 
时 候 上 自动 为 我 们 调用 此 窗口 过 程 。 





窗口 过 程 的 函数 签名 共有 4 个 参数 。 





1. hwnd: 接收 此 消息 的 窗口 的 句柄 。 


2. msg: 标识 特定 消息 的 预定 值 。 例如， 窗口 的 退出 消息 被 定义 
为 WM_QUIT。 前 级 WM 表示 “窗口 消息 ”(Window Message) 。 预 定义 的 窗 
口 消息 有 上 百 种 ， 有 具体 可 参考 MSDN 库 。 





3. wParam: 与 具体 消息 相关 的 额外 信息 。 


4. lParam: 与 具体 消息 相关 的 人 额外 信息 。 





我 们 编写 的 窗口 过 程 会 处 理 3 种 消 轧 ， 分 别 
是 WM_LBUTTONDOWN、WM_KEYDOWN 与 WM_DESTROY。 当 用 户 在 窗口 的 工 
作 区 点 击 鼠 标 左 键 时 ， 便 会 发 送 一 次 NM_LBUTTONDOWN 消 息 。 当 有 非 键 
盘 键 被 按 下 时 ， 就 会 癌 具 有 当前 焦点 的 窗口 发 送 NM_KEYDOWN 消 息 。 当 
窗口 被 销毁 时 ， 便 会 发 送 NM_DESTROY 消 息 。 








我 们 编写 的 处 理 代码 也 相当 简单 ， 当 接收 到 WM_LBUTTONDOWN 消 轧 
时 就 弹出 一 个 打印 着 “Hello, World” 字 样 的 消息 框 : 


case WM _LBUTTONDOWN: 


MessageBox(60, L"Hello, World", L"Hello", MB_OK); 
return 0©; 





当 窗 口 收 到 NM_KEYDOWN 消 息 时 ， 我 们 就 先 检测 用 户 按 下 的 是 否 为 
Esc 键 。 若 果真 如 此 ， 则 通过 DestroyWindow 函 数 销毁 应 用 程序 主 窗 
口 。 此 时 ， 传 入 窗口 过 程 的 wParam 参数 即 为 用 户 按 下 的 特定 键 的 虚拟 
键 代 人 码 (virtual key code) ， 我 们 可 以 认为 它 是 特定 键 的 标识 符 。 
Windows 头 文件 含有 一 系列 用 于 确定 按键 的 虚拟 键 代 码 。 例 如 ， 通 过 检 
测 虚 拟 键 代码 常量 VK_ESCAPE， 便 可 知晓 用 户 按 下 的 是 否 为 Esc 键 。 





case WM KEYDOWN: 
if( wParam == VK_ESCAPE ) 


DestroyWindow(ghMainWnd); 
return 0©; 








文 曾 提 到 ， 参 数 wParam 与 Param 都 被 用 于 指定 特定 消息 的 额外 
信息 。 es wParam 参数 指示 的 是 用 户 按 下 的 虚 
拟 键 代码 。MSDN 库 为 每 一 种 Windows 消 息 都 罗列 出 了 对 应 的 wParam 
与 1Param 参 数 信息 。 





当 窗 口 被 销毁 时 ， 我 们 会 以 PostQuitMessage 函 数 〈 该 函数 会 终 
止 消息 循环 ) 发 出 NM_QUIT 消 息 。 
case WM_DESTROY : 


PostQuitMessage(6) ; 
return 0) 


在 窗口 过 程 的 结尾 ， 我 们 会 调用 另 一 个 名 为 DefNindowProc 的 函 
数 ， 函数 是 默认 的 窗口 过 程 。 在 本 章 的 基本 Windows 应 用 程序 之 
中 ， i 寺 程 仅 能 处 理 3 种 消息 ， 而 窗口 接收 到 的 其 他 消息 
则 都 要 交 给 DefWindowProc 函 数 ， 由 其 中 定义 的 默认 方法 来 进行 处 理 。 








比如 说 ， 该 程序 的 窗口 可 能 需要 执行 最 小 化 、 最 大 化 、 调 整 大 小 或 关闭 
等 操作 ， 由 于 我 们 并 不 希望 自行 处 理 这 些 消 轧 ， 所 以 这 些 功能 就 要 交 由 
默认 的 窗口 过 程 来 实现 。 


A.3.7 消息 框 函数 


最 后 ， 有 一 种 API 函 数 我 们 还 未 曾 介绍 过 ， 那 承 是 MessageBox 函 
数 。 在 辐 用 户 展示 信息 以 及 为 程序 快速 地 获取 输入 这 两 方面 ， 它 为 我 们 
提供 了 一 种 极其 捷 便 的 途径 。 消 息 框 函数 的 声明 如 下 : 








int MessageBox( 
HWND hwnd， // 该 消息 框 所 属 窗口 的 句柄 ， 可 以 指定 为 NULL 
LPCTSTR lpText，// 消息 框 中 显示 的 文本 

















LPCTSTR lpCaption,// 消息 框 的 标题 文本 
UINT uType // 消息 框 的 样式 


了 





MessageBox 函 数 的 返回 值 依 赖 于 所 用 消息 框 的 具体 类 型 。 对 于 可 
能 的 返回 值 与 消息 框 样式 ， 可 参考 MSDN 库 。 图 A.5 所 示 的 是 一 种 带 
有 “Yes” 和 “No” 选 项 的 消息 框 。 










乒 
Quit 








Do you want to quit? 














TH 





图 A.5 ” 带 有 “Yes” 和 “No" 选 项 的 消息 








A.4 一 种 更 灵活 的 消息 循环 


对 于 办 公 软 件 或 网 络 浏览 器 等 传统 应 用 程序 而 言 ， 游 戏 软件 与 之 差 
别 较 大 。 一 般 来 讲 ， 游 戏 程序 采用 的 并 非 是 坐等 消息 的 模式 ， 而 是 要 时 
时 进行 更 新 。 这 便 暴 露出 了 一 个 问题 ， 如 果 普 通 程序 的 消息 队列 中 没有 
消息 ， 那 么 函数 GetMessage 将 使 线程 进入 休眠 状态 并 等 待 消息 的 到 
来 。 但 与 游戏 程序 相 比 ， 如 果 没 有 要 处 理 的 Windows 消 息 就 应 执行 游戏 
的 逻辑 代码 。 解 决 方法 是 以 PeekMessage 函 数 蔡 代 GetMessage 函 数 。 
如 果 消 息 队 列 中 并 无 消息 ， 则 PeekMessage 函 数 将 立即 返回 。 这 样 一 
来 ， 代 码 中 的 新 式 消 息 循环 将 变 为 : 





int Run() 
MSG msg = {0}; 


while(msg.message != WM QUIT) 








// 如 果 消 息 队 列 中 有 窗口 消息 则 进行 处 理 
if(PeekMessage( &msg, 60, 60, 60, PM REMOVE )) 

















TranslateMessage( &msg ); 
DispatchMessage( &msg ); 











} 
// 否则 执行 动画 或 游戏 逻辑 部 分 的 代码 


else 





return (int)msg.wParam; 





实例 化 msg 变 量 之 后 ， 我 们 将 进入 一 个 无 限 循环 。 在 这 里 ， 首 先 要 


调用 API 函 数 PeekMessage 来 检测 消息 队列 ， 其 参数 的 描述 可 参考 
MSDN 库 。 若 有 消息 ， 则 返回 true 并 对 该 消息 进行 处 理 。 若 没有 消息 
则 PeekMessage 函 数 返 回 false， 然 后 执行 我 们 编写 的 游戏 逻辑 代码 。 


A.5 小 结 


1. 为 了 使 用 Direct3D， 我 们 必须 创建 具有 一 个 主 窗口 的 Windows 应 
用 程序 ， 以 此 来 演 染 3D 场 景 。 而 且 ， 对 于 游戏 类 程序 而 言 ， 应 创建 一 
种 用 于 检测 消息 的 特殊 消 恩 循环 。 如 采 有 消息 则 对 它们 进行 处 理 ， 人 否则 
就 执行 游戏 逻辑 。 





2. 多 个 Windows 应 用 程序 可 以 同时 运行 ， 因 此 Windows 操 作 系统 必 
须 管 理 这 些 程序 所 需 资 源 ， 并 将 消息 传递 到 相应 的 目标 程序 。 当 一 个 应 
用 程序 发 生 事件 《键盘 按键 、 点 击 鼠 标 、 计 时 需 等 ) 时 ， 就 会 有 对 应 的 
消息 发 送 至 该 应 用 程序 的 消息 队列 之 中 。 


3. 每 个 Windows 应 用 程序 都 有 一 个 消 轧 队列 ， 用 于 存储 该 程序 接 
收 到 的 消 妃 。 应 用 程序 的 消 恩 循环 会 不 断 检 测 队 列 中 的 消 思 ， 并 将 它们 
分 发 到 相应 的 目标 窗口 过 程 。 值 得 注意 是 ， 一 球 应 用 程序 可 能 会 拥有 多 
个 窗口 。 





4. 窗口 过 程 是 一 种 需要 我 们 目 行 实现 的 特殊 回调 函数 ， 当 应 用 程 
序 中 的 窗口 收 到 消 轧 ，Windows 操 作 系统 便 会 立即 调用 它 。 在 窗口 过 程 
的 内 部 ， 我 们 根据 目 己 的 需求 为 特定 消 妃 的 处 理 而 编写 执行 代码 。 如 果 
我 们 对 茶 些 消 妃 没有 特别 的 处 理 需 求 ， 则 将 它们 转发 到 默认 的 窗口 过 程 
以 默认 方法 进行 处 理 。 











A.6 练习 





1. 修改 A.2 市 中 的 示例 程序 ， 为 它 配 上 不 同 的 图 标 、 光 标 以 及 背景 
颜色 。 


提示 


在 MSDN 库 中 查阅 LoadIcon、LoadCursor 与 GetStock0bject 这 3 
种 函数 的 信息 。 


2. 修改 A.2 节 中 的 示例 程序 ， 对 WM_CLOSE 消 息 进行 相应 的 处 理 。 
nd 口 或 应 用 程序 即将 关闭 。 我 们 要 实现 的 效果 是 : 此 消 
恩 发 来 时 ， 通 过 消息 框 函数 向 用 户 显 示 出 一 个 附 有 是 /和 否 选项 的 消息 
框 ， 询 问 是 否 真 的 需要 退出 。 如 果 用 户 选择 "是 ” 便 销 毁 此 窗口 ， 人 否则 返 
回 之 前 的 程序 逻辑 ， 继 续 正 常 运行 。 通 过 这 种 方法 ， 我 们 就 可 以 在 程序 
退出 时 询问 用 户 是 aa 




















3. 为 A.2 节 中 的 示例 程序 添加 对 NM_CREATE 消 息 的 处 理 。 
在 CreateWindow 函 数 返 回 之 前 ， 此 消息 将 被 发 送 到 即将 被 创建 的 窗 
过 消息 框 函 数 输出 信息 ， 以 示 此 窗口 创建 完毕 。 


4. 合 阅 MSDN 库 中 的 Sleep 函 数 ， 并 以 自己 的 理解 对 此 函数 的 功能 


5. 查阅 MSDN 库 中 的 WM_SIZE 与 WM_ACTIVATE 消 息 ， 用 自己 的 话 
来 阐述 这 两 种 消息 在 什么 情况 下 才 会 被 发 送出 去 。 


[1] 此 书 的 最 新 版 本 现 为 第 6 版 。 但 针对 本 书 Direct3D 编 程 的 这 一 主 
题 ， 还 是 建议 读者 阅读 此 书 的 第 5 版 。 第 5 版 使 用 C 语 言 ， 内 容 介 绍 的 是 
比较 基础 的 win32 API 编 程 ， 与 本 书 所 需 的 知识 更 为 接近 。 而 第 6 版 主要 
使 用 C# 语 言 ， 更 注重 最 新 系统 平台 上 的 编程 方法 。 





[2] 我 们 要 注意 的 是 应 用 程序 可 能 会 执行 空间 处 理 (idle processing) 。 
这 是 在 没有 事件 发 生 时 应 用 程序 所 执行 的 一 种 特殊 任务 。 原作 者 注 











[3] 每 个 窗口 都 拥有 一 个 窗口 过 程 ， 但 窗口 之 间 也 能 共享 相同 的 窗口 过 
程 。 因此， 不 一 定 要 为 每 个 窗口 都 编写 独立 的 窗口 过 程 。 当 然 ， 如 果 硕 
望 不 同 的 窗口 以 不 同 的 方式 来 处 理 消 息 ， 那 么 应 为 它们 分 别 设置 不 同 的 
窗口 过 程 。 原作 者 注 














附录 B ”高 级 着 色 器 语言 参考 由 


B.1 变量 类 型 
B.1.1 标量 类 型 

1. bool: 取 值 非 真 即 假 。 注 意 ，HLSL 为 此 而 提供 了 类 似 于 C++ 语 
言 中 的 true 与 false 关 键 字 。 

2. int: 32 位 有 符号 整数 。 

3. half: 16 位 浮 点 数 。 

4. float: 32 位 浮 点 数 。 

5. double: 64 位 浮 点 数 。 

有 些 平台 可 能 不 支持 ijnt、half 与 double 这 几 种 类 型 。 遇 到 这 种 情 
况 便 会 用 float 对 这 些 类 型 进行 模拟 。 
B.1.2 问 量 类 型 


1. float2: 2D 回 量 ， 其 中 的 分 量 都 是 float 类 型 。 


2. float3: 3D 癌 量 ， 其 中 的 分 量 都 是 float 类 型 。 


3. float4: 4D 癌 量 ， 其 中 的 分 量 都 是 float 类 型 。 


我 们 也 可 以 用 非 float 类 型 的 分 量 来 创建 同 量 ， 如 
int2、half3、bool4。 





我 们 能 够 通过 与 数组 或 构造 函数 相似 的 语法 来 初始 化 器 量 。 


float3 v {1.6f, 2.6f, 3.6f}; 


float2 w = float2(x, y); 
float4 u = float4(w, 3.6f, 4.6f); // uu = (w.x, w.y, 3.6f, 4.6f) 





还 以 利用 数组 下 标语 法 来 访问 向 量 中 的 分 量 。 比 如 说 ， 要 设置 向 量 
vec 中 的 第 ;个 分 量 可 以 写成 : 


除 此 之 外 ， 我 们 还 能 够 通过 规定 的 分 量 名 z、Y、z、w、 r、9、b、a 
像 访问 结构 体 成 员 那 样 来 访问 回 量 vec 的 各 分 量 。 





分 量 名 r、9、b、a 分 别 对 应 于 分 量 名 rz、y、z、w， 就 像 上 述 范例 所 
示 ， 每 一 对 所 获取 的 是 同一 个 向 量 分 量 。 当 我 们 用 向 量 来 表示 颜色 时 ， 
RGBA 表 示 法 会 更 党 青睐 ， 这 是 因为 它 的 分 量 名 与 表示 的 颜色 更 加 吻 








考虑 这 样 一 种 情况 ， 假 设 有 向 量 * = (ur ww)， 欲 将 wx 中 的 分 量 
复制 到 向 量 v， 令 ?= (www, wwwz)。 最 直接 的 解决 方案 就 是 将 向 量 w 中 
的 分 量 根据 需求 分 别 复制 到 向 量 v 内 。 但 是 ，HLSL 为 这 种 按 乱 序 复 制 向 
量 分 量 的 情况 ， 专 门 提 供 了 一 种 名 为 重组 〈swizzleing， 也 有 译作 混 
合 、 重 排 等 ) 的 特殊 语法 。 

















{1.9f，2.6f，3.6f，4.6f}; 
{6.9f，6.6f，5.6f，6.6f}; 


Vv = U.wyyx; // v = {4.6f，2.6f，2.6f，1.6f} 


float4 u 


= {1.6f， ，3.6f，4.6f}; 
float4 v = {6.6f 


2 
，6.9f，5.6f，6.6f}; 


Vv = U.wzyx; // v = {4.6f，3.6f，2.6f，1.6f} 








这 样 ， 在 复制 向 量 时 ， 整 不必 按部就班 地 依次 复制 每 一 个 分 量 了 。 
举 个 例子 ， 我 们 可 以 如 下 列 代 码 所 示 ， 仅 将 问 量 u 中 的 z-、y 分 量 复制 到 
向 量 z 中 。 





float4 u 
float4 v 


，3.06f，4.6f}; 
，5.06f，6.6f}; 


VvV.Xy = u; // v = {1.6f, 2.6f, 5.6f, 6.6f} 





B.1.3 ”矩阵 类 型 


我 们 能 够 以 下 列 语法 来 定义 一 个 m x n 和 矩阵 ， 其 中 以 与 的 取 值 范围 


都 在 1 一 4。 


floatmxn matmxn; 


沁 例 : 


1. float2x2: 2 


2. float3x3: 


3. float4x4: 


4. float3x4: 





该 算 阵 元 素 的 类 型 都 为 float。 


该 矩阵 元 素 的 类 型 都 为 float。 


该 阜 阵 元 系 的 类 型 都 为 float。 


该 矩阵 元 素 的 类 型 都 为 float。 


我 们 也 可 以 用 非 float 类 型 的 分 量 来 创建 算 阵 ， 如 


int2x2、half3x3 和 和 bool4x4。 


我 们 能 够 以 二 维 数组 的 双 下 标语 法 来 访问 矩阵 中 的 项 。 例 如 ， 为 了 
设置 矩阵 中 第 i 行 第 ] 列 的 元 素 ， 我 们 可 以 这 样 写 : 


除 此 之 外 ， 还 可 以 依照 访问 结构 体 成 员 的 方式 来 获取 矩阵 WY 中 的 元 
素 。 和 窍 阵 元 素 的 名 称 定义 如 下 : 














以 1 作为 起 始 值 的 索引 : 








有 时 候 我 们 希望 能 提取 引用 矩阵 中 特定 的 行 回 量 ， 这 可 以 通过 数组 
的 单 下 标语 法 来 实现 。 例 如 ， 为 了 提取 3 x 3 乞 阵 中 第 ; 行 的 行 网 量 ， 
可 写作 : 











在 接 下 来 的 示例 中 ， 我 们 要 为 矩阵 中 的 3 个 行 回 量 分 别 赋值 : 





float3 N 
float3 T 


normalize(pIn.normalW); 

normalize(pIn.tangentW - dot(pIn.tangentW, N)*N); 
float3 B = cross(N,T); 

float3x3 TBN; 











TBN[8] = Ti // 给 第 一 个 行 向 量 赋 值 
TBN[1] = B; // 给 第 二 个 行 癌 量 赋值 
TBN[2] = N; // 给 第 三 个 行 向 量 赋 值 

















也 可 以 用 向量 来 构建 矩阵 : 


float3 N = normalize(pIn.normalW); 
float3 T = normalize(pIn.tangentW - dot(pIn.tangentW, N)*N); 
float3 B = cross(N,T); 





float3x3 TBN = float3x3(T, B, N); 


除了 利用 float4 与 float4x4 类 型 来 表示 4D 癌 量 与 4 x 4 窍 阵 外 ， 我 
们 还 可 以 使 用 vector 与 natrix 类 型 来 加 以 代替 : 


vector u = {1.6f, 2.6f, 3.06f, 4.6f}; 
matrix M; // 4x4 和 矩阵 


B.1.4 数组 


我 们 可 以 通过 类 似 于 C++ 的 语法 来 声明 一 个 特定 类 型 的 数组 ， 例 
如 : 
float M[4][4]; 


half pl[4]; 
float3 v[12]; // 12 个 3D 疝 量 





B.1.5 结构 体 





HLSL 与 C++ 中 定义 结构 体 的 方式 基本 上 完全 一 致 ， 区 别 仅 在 于 
HLSL 中 的 结构 体 不 具有 成 员 函 数 。 以 下 是 一 个 HLSL 结 构 体 的 相关 示 
例 。 





struct SurfaceInfo 

{ 
float3 pos; 
float3 normal; 
float4 diffuse; 
float4 spec; 


}; 


SurfaceInfo v; 

litColor += Vv.diffuse; 

dot(lightVec, v.normal); 

float specPower = max(v.spec.a, 1.6f); 





B.1.6 typedef 关键 字 


HLSL 中 的 typedef 关 键 字 与 C++ 中 的 功能 完全 相同 。 比 如 ， 可 以 通 
过 以 下 语法 来 把 point 定 义 为 vector<float，3> 类 型 的 别称 : 


typedef float3 point; 


此 后 ， 如 果 和 希望 声明 : 


float3 myPoint; 


就 可 以 写作 : 


point myPoint; 


再 来 看 另 一 个 示例 ， 它 展示 了 如 何 通过 HLSL 中 的 typedef 与 const 
关键 字 来 定义 类 型 〈 效 果 与 C++ 中 的 一 致 ) : 


B.1.7 变量 的 修饰 符 


下 列 关键 字 可 以 作为 变量 声明 的 修饰 符 。 


1. static: 基本 上 与 修饰 符 extern 的 作用 相反 ， 意 即 以 static 
修饰 的 着 色 器 变量 对 于 C++ 应 用 程序 而 言 是 不 可 见 的 。 


static float3 v = {1.6f, 2.6f, 3.6f}; 


2. uniform: 对 于 经 此 修饰 符 标 记 的 变量 而 言 ， 此 值 可 以 在 C++ 应 
用 层 改 变 ， 但 在 着 色 器 执行 (处 理 顶 点 、 像 素 ) 的 过 程 中 ， 其 值 始终 保 
持 不 变 〈 其 间 可 将 其 看 作 一 种 常量 ) 。 因 此 ，uniform 变 量 都 是 在 着 色 
器 程序 之 外 进行 初始 化 的 〈 例 如 ， 在 C++ 应 用 程序 中 得 到 初始 化 ) 。 

















3. extern: 经 此 关键 字 修 饰 的 变量 会 暴露 给 C++ 应 用 程序 端 〈 即 
该 变量 可 以 被 着 色 器 之 外 的 C++ 应 用 代码 访问 到 ) 。 着 色 右 程序 中 的 全 
局 变量 被 默认 为 既 uniform 且 extern。 








4. const: HLSL 中 的 const 关 键 字 与 C++ 中 的 意义 相同 。 这 束 是 
说 ， 如 果 一 个 变量 由 const 关 键 字 来 修饰 ， 那 么 它 为 一 个 常量 ， 其 值 将 
不 可 更 改 。 


B.1.8 强制 类 型 转换 


HLSL 有 着 极其 灵活 的 强制 转换 〈casting) 机 制 。HLSL 中 的 强制 转 
换 语法 与 C 编 程 语言 中 的 相同 。 例 如 ， 将 一 个 float 类 型 强制 转换 为 一 


个 matrix 类 型 可 写作 : 


float f = 5.60f; 








float4x4 m = (float4x4)f; // 将 浮 点 数 f 复 制 到 矩阵 m 中 的 每 一 元 素 当 中 





这 种 把 标量 强制 转换 为 矩阵 的 做 法 ， 实 为 将 此 标量 复制 给 矩阵 中 的 
每 一 元 系 。 


再 来 研究 下 面 的 实例 : 


float3 n = float3(...); 





float3 v = 2.6f*n - 1.6f; 








2.6f*n 只 是 一 个 标量 与 向 量 的 乘法 ， 这 个 好 理解 。 然 而 ， 接 下 来 
的 操作 是 回 量 与 标量 相 减 。 此 时 ， 标 量 1.6f 被 扩充 为 (1.6f，1.ef， 
1.6f)， 因 此 上 述 语句 实际 执行 如 下 : 


float3 v = 2.6f*n - float3(1.6f, 1.6f, 1.6f); 


就 本 书 中 的 示例 而 言 ， 我 们 现在 应 当 有 能 力 根据 语法 推测 出 其 强制 
转换 后 的 语句 。 至 于 强制 转换 的 一 系列 完整 规则 ， 可 搜索 SDK 文 档 中 
的 “Casting and Conversion”( 强 制 类 型 转换 与 类 型 转换 ) 部 分 。 

















B.2 关键 字 与 运算 符 
B.2.1 关键 字 


为 了 便于 参考 ， 下 面 列 出 HLSL 中 定义 的 常用 关键 字 清 单 P。 


asm, bool, compile, const, decl, do, 
double, else, extern, false, float, for., 
half, if, in, inline, inout, int, 


matrix, out, pass, pixelshader, return, sampler, 
shared, static, string, struct, technique, texture, 
true, typedef, uniform, vector, vertexshader, void, 
volatile, while 





接 下 来 所 示 的 关键 字 为 保留 的 或 未 使 用 的 标识 符 ， 但 它们 或 许 会 在 
未 来 成 为 关键 字 []。 
auto, break, case, catch, char, class, 


const cast, continue, default, delete, dynamic cast, enum, 
explicit, friend, goto, long, mutable, namespace, 


new, operator, private, protected, public, register., 
reinterpret cast, short, signed, sizeof, static cast, switch, 
template, this, throw, try, typename, union, 

unsigned, using, virtual 





B.2.2 ”运算 符 


HLSL 文 持 许 多 类 似 于 C++ 中 的 运算 待 ， 除 了 后 面 介绍 的 少数 几 种 
特例 之 外 ， 它 们 的 用 法 与 C++ 中 的 一 致 。 下 面 表格 中 所 列 的 即 为 HLSL 
中 的 运算 符 。 














上 面 提 到 ，HLSL 中 的 运算 符 与 C++ 中 的 非常 相似 ， 尽 管 如 此 ， 仍 
会 有 一 些 差异 。 首 先 ，HLSL 中 的 取 模 运算 符 % 既 可 以 用 于 整数 也 能 
于 浮 点 数 。 而 且 ， 要 进行 模 运 算 就 必须 保证 取 模 运算 符 左右 操作 数 都 具 
有 相同 的 符号 〈 例 如 ， 要 么 都 为 正 数 ， 要 么 都 为 负数 ) 。 





其 次 ， 我 们 可 以 看 出 HLSL 中 的 不 少 运 算是 以 分 量 为 基准 展开 的 ， 
这 和 古 因为 HLSL 引 入 的 问 量 和 和 矩阵 等 内 置 类 型 都 是 由 寿 干 分 量 构成 所 导 
致 的 。 有 了 这 种 按 分 量 进 行 运算 的 规则 ， 我 们 就 可 以 将 本 用 于 标量 类 型 
运算 的 算 符 ， 亦 用 作 执 行 如 回 量 与 矩阵 之 间 的 加 、 减 法 运算 以 及 相等 测 
试 。 下面 是 一 些 相关 示例 。 














在 标量 计算 的 过 程 中 ，HLSL 运 算 符 的 行为 与 一 般 普 通 C++ 程 序 中 
的 相 一 致 。 





float4 u = {1.6f, 06.6f, -3.6f, 1.6f}; 


float4 v = {-4.6f, 2.6f, 1.6f, 0.6f}; 


// 将 对 应 的 分 量 相 加 
float4 sum = u + VvV; // sum = (-3.6f, 2.06f, -2.6f, 1.6f) 














器 量 的 自 增 运算 就 是 使 它 的 每 个 分 量 都 加 1。 


// 自 增 之 前 : sum = (-3.6f，2.6f，-2.6f，1.6f) 








sum++; // 自 增 之 后 : sum = (-2.6f，3.6f，-1.6f，2.6f) 





器 量 的 分 量 式 乘法 运算 如 下 。 


float4 u {1.6f, 60.6f, -3.06f, 1.6f}; 
float4 v {-4.6f, 2.606f, 1.6f, 90.6f}; 


// 将 对 应 的 向 量 相 乘 
float4 product = u * v; // product = (-4.6f, 6.6f, -3.6f, 90.6f) 





如 果 有 两 个 矩阵 : 


float4x4 B; 
那么 ， 语 法 4 * 8B 表示 的 是 分 量 式 乘法 ， 而 不 是 矩阵 乘法 。 大 要 进 
行 矩 阵 乘 法 运算 ， 则 需要 使 用 mu1 函 数 。 








比较 运算 符 也 是 按 分 量 一 一 进行 比 对 的 ， 它 返回 的 是 由 bool 类 型 分 








量 组 成 的 问 量 或 符 阵 ， 其 中 的 poo1 值 即 为 对 应 分 量 的 比较 结果 。 例 如 : 


.9f，6.9f，-3.6f，1.6f}; 
.9f，6.9f，1.6f，1.6f}; 





float4 b = (yu == VvV); // b = (false, true, false, true) 





最 后 ， 我 们 以 二 元 运算 中 变量 类 型 的 提升 规则 (variable 
promotion〉 作为 本 节 的 结束 。 











1. 对 于 二 元 运算 来 说 ， 如 果 运 算 符 左右 操作 数 的 维度 不 同 ， 那 么 
维度 较 小 的 变量 类 型 将 被 提升 “自动 转换 ) 为 维度 较 大 的 变量 类 型 。 比 
如 说 ， 如 果 z 的 类 型 为 float， 而 y 的 类 型 为 float3。 那 么 ， 在 表达 式 
(rz 二 YW) 中 ， 变 量 z 的 类 型 将 被 提升 为 float3， 而 且 表 达 的 计算 结果 类 型 
也 为 float3。 变 量 类 型 的 提升 依赖 于 自动 转换 的 定义 ， 像 本 例 这 种 情 
况 就 会 发 生 * 标 量 至 向 量 ”(scalar-to-vector) 的 自动 转换 。 因 此 ， 在 上 述 
计算 过 程 中 ，z 就 会 按 标 量 至 同 量 自动 转换 的 定义 ， 提 升 为 float3 变 为 
7 三 7,7,7)。 值 得 注意 的 是 ， 如 果菜 种 自动 转换 行为 没有 定义 ， 那 么 其 
相应 的 类 型 提升 也 就 不 复 存 在 。 例 如 ， 我 们 不 能 将 类 型 float2 提 升 为 
类 型 float3， 因 为 并 不 存在 这 样 的 自动 转换 定义 。 





























2. 对 于 二 元 运算 来 讲 ， 如 采 运 算 符 左 右 操 作 数 的 类 型 不 同 ， 那 么 
低 精 度 变 量 的 类 型 将 被 提升 (自动 转换 ) 为 高 精度 变量 的 类 型 。 例 如 ， 
若 z 的 类 型 为 int 且 y 的 类 型 为 haal1f， 那 么 ， 在 表达 式 (7 + 中， 变量 z 的 
类 型 将 被 提升 至 half， 而 且 表 达 式 运算 结果 的 类 型 亦 为 half。 


B.3 程序 中 的 控制 流 





HLSL 文 持 一 些 C++ 中 常见 的 选择 、 循 环 以 及 顺序 程序 流 控 制 语 
人 句 。 这 些 语句 的 语法 与 C++ 中 的 一 模 一 样 。 


return 语 人 句 : 


return (expression); 


if 与 让 ..else 语 句 : 


if( _ condition ) 


statement(s ) ; 


} 
if( condition ) 
{ 

statement(s); 
} 


else 


{ 
statement(s); 
} 





for 语 句 : 


for(initial; condition; increment) 


{ 


statement(s); 


} 





while 语 人 句 : 


while( condition ) 


{ 
} 


statement(s); 





do...while 语 句 : 


do 
{ 


statement(s); 
}while( condition ); 





B.4 函数 


B.4.1 用 户 目 定义 函数 
HLSL 中 的 函数 具有 以 下 属性 。 
1. 函数 采用 类 C++ 语法 。 


2. 参数 只 能 按 值 传递 。 


VS 


3. 不 文 持 递 归 。 


4. 只 有 内 联 函 数 。 


而 且 ，HLSL 还 专 为 函数 添加 了 一 些 额 外 的 关键 字 。 人 例如， 考虑 下 
列 以 HLSL 编 写 的 函数 。 





bool foo(in const bool b，// 输入 的 boo1 类 型 参数 
out int r1， // 输出 的 ijnt 类 型 参数 
inout float r2) // 同时 兼 具 输入 /输出 属性 的 float 类 型 参数 





















































{ 
if( b ) // 测试 输入 值 
{ 
rl = 5; // 通过 r1 输 出 一 个 值 
} 
else 
{ 
rl = 1; // 通过 r1 输 出 一 个 值 
} 


// 因为 r2 的 类 型 为 jnout， 所 以 既 可 把 它 作 为 输入 值 ， 也 能 通过 它 来 输出 值 


P2 = r2 * r2 * r2; 





return true; 


除了 in、out 与 inout 关 键 字 以 外 ，HLSL 中 函数 的 语法 基本 与 
C++ 中 的 函数 相 一 致 。 


1. in: 在 目标 函数 执行 之 前 ， 此 修饰 符 所 指定 的 参数 应 从 调用 此 
函数 的 程序 中 复制 有 输入 的 数据 。 我 们 其 实 不 必 显 式 地 为 参数 指定 此 修 
饰 符 ， 在 默认 的 情况 下 参数 都 为 in 类 型 。 例 如 ， 下 面 两 种 写法 是 等 价 
的 ; 


float square(in float x) 
{ 

return x * x; 
} 


这 是 没有 显 式 指定 in 的 写法 : 





float square(float x) 


{ 
return x * x; 
} 


2. out: 在 目标 函数 返回 时 ， 此 修饰 符 所 指定 的 参数 应 当 已 经 复制 
了 该 函数 中 的 最 后 计算 结果 。 借 此 即 可 方便 地 返回 数值 。 关 键 字 out 的 
存在 是 很 有 必要 的 ， 因 为 HLSL 既 不 允许 按 引 用 的 方式 传递 数据 ， 也 不 
允许 使 用 指针 。 需 要 注意 的 是 ， 如 果 一 个 参数 被 标记 为 out， 那 么 此 参 
数 在 目标 函数 执行 之 前 不 能 被 复制 任何 值 。 换 言 之 ，out 参 数 只 能 用 于 
输出 数据 ， 而 不 能 用 于 输入 数据 。 








void square(in float x, out float y) 


y= XxX* x 


} 
在 这 个 阔 数 中 ， 我 们 通过 z 来 输入 的 数 ， 并 以 参数 y 来 返回 7 平方 的 
eh 


3. inout: 此 修饰 符 表 示 参 数 兼 有 in 与 out 的 属性 。 如 果 和 希望 某 个 
参数 既 可 输入 又 可 输出 就 可 用 inout。 


ee square(inout float x) 


个 示例 中 ， 我 们 不 仅 通 过 z 来 输入 底数 ， 返回 底数 平方 的 
四 


B.4.2 ”内置 水 数 


HLSL 为 用 户 提 供 了 一 组 丰富 的 内 置 函 数 ， 这 对 于 3D 图 形 的 绘制 来 
讲 无 疑 是 很 有 帮助 的 。 以 下 列表 描述 了 常用 的 内 置 函 数 。 























2 |ceil(x) 返回 之 工 的 最 小 整数 











| 回 工 的 余弦 值 ，ZI 的 单位 为 弧度 






























































lip(x) 函数 仅 限 在 像素 着 色 中 调用 ， 如 果 工 < 
clip(x EE | 句 
当前 的 像素 从 后 续 的 处 理 流程 中 丢弃 


TN 





























de 估算 屏幕 空间 中 的 偏 导 数 0P/0T。 这 使 我 们 可 以 确定 在 
x(p 
屏幕 空间 的 2 轴 方向 上 ， 相 邻 像素 间 某 属性 值 P 的 变化 量 





0， 就 将 








估算 屏幕 空间 中 的 偏 导数 2P/OV。 这 使 我 们 可 以 确定 在 


























将 I 从 弧度 转化 为 角度 


determinant(M) | E 阵 的 行列 式 














: 站 | “ 


此 函数 返回 的 是 目标 浮 点 数 的 小 数 部 分 ( 即 








互 





ddy(p) EE 
i 屏幕 空间 的 VYV 轴 方 铝 上 ， 相 邻 像 素 间 某 属 性 值 了 的 变化 量 





尾数 ) 。 











I 如 。 状 三 (2395020 0900332) TR 
frac{z) = (0.52.0.32) 





lerp(u, v, 七 ) 


如 果 之 Yj 返 回 z， 否 则 返回 ! 





















































返回 矩阵 乘积 JMIJIN 。 但 要 注意 ， 和 矩阵 乘积 JMLIN 必须 要 
有 定义 。 如 果 J 儿 是 一 个 向 量 ， 就 将 它 作 为 一 个 行 向 量 进 

mul(M, N) 行 回 量 与 算 阵 的 乘法 运算 ， 使 乘积 有 定义 。 类 似 地 ， 如 
果 人 入 是 一 个 向 量 ， 束 把 它 当 作 一 个 列 向 量 ， 并 进行 矩阵 
与 回 量 的 乘法 运算 ， 使 乘积 有 定义 
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ee 本 根据 给 出 的 表面 法 线 尺 、 入 射 向 量 Vw 以 及 两 种 材质 的 折射 
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FE 切 值 ，Z 的 单位 为 弧度 























0 
返回 矩阵 JM 的 转 置 和 矩阵 MT 


， Texture2D::Sample (S， | 根据 Samplerstate 对 象 s 与 2D 纹 理 坐 标 texc， 返 回 2D 纹 理 
35 


























texC) 图 中 相应 的 颜色 数据 








根据 samplerstate 对 象 s、2D 纹 理 坐 标 texc 以 及 mipmap 层 


级 mipLevel， 从 2D 纹 理 图 中 返回 相应 的 颜色 数据 。 此 函 
了 Texture2D: :SampleLevel 数 与 Texture2D: :sample 函 数 的 不 同 之 处 在 于 第 三 个 参数 ， 
3， Texc， mipleve1) | 即 需 要 用 户 亲自 指定 采样 时 所 用 的 mipmap 层 级 。 例 如 ， 
我 们 可 以 将 它 指定 为 0 来 访问 最 顶级 的 mipmap 
LOD (level of detail， 细 节 级 别 ， 也 有 译作 细节 层次 ) 








TextureCube: :Sample(S, | 根据 samplerstate 对 象 s 以 及 3D 查 找 向 量 v 来 返回 立方 体 
v) 图 中 相应 的 颜色 数据 





根据 samplerstate 对 象 s ( 前 文中 讲 过 ， 采样 器 状态 指 
































定 了 纹理 过 滤器 与 纹理 的 寻 址 模式 ) 以 及 3D 纹 理 坐 

标 texc《〈 前 两 个 坐标 为 普通 的 2D 纹 理 坐 标 ， 而 第 三 个 坐 
标 则 用 于 指定 数组 的 索引 ) ， 返 回 2D 纹 理 数 组 中 相应 的 
颜色 








Texture2DArray::Sample 














(S, texC) 





大 多 数 的 函数 能 以 重 载 的 方式 使 所 有 内 置 类 型 的 计算 变 得 有 意义 。 
例如 ， 所 有 的 标量 类 型 都 可 以 通过 abs 函 数 来 计算 绝对 值 ， 这 就 是 说 ， 
此 函数 会 针对 不 同 的 标量 类 型 执行 不 同 的 重 载 方 法 。 再 如 又 积 函 
数 cross， 它 仅 文 持 3D 回 量 的 计算 ， 所 以 它 只 能 针对 由 某 种 类 型 所 组 成 
的 3D 向 量 ( 例 如，int、float、double 等 类 型 所 构成 的 3D 向 量 ) 进行 
重 载 。 男 一 方面 ， 因 为 线性 插值 函数 lerp 可 以 使 标量 、2D、3D 以 及 4D 


问 量 的 计算 均 有 意义 ， 所 以 该 函数 支持 对 所 有 类 型 的 重 载 。 


如 果 以 “标量 ”函数 〈( 即 通常 针对 标量 进行 运算 的 函数 ， 如 cos (x)) 
来 对 非 标 量 类 型 进行 计算 ， 那 么 该 函数 将 对 每 个 分 量 依 次 展开 运算 。 例 
如 ， 如 果 我 们 有 下 列 代 码 : 





float3 v = float3(6.6f, 60.6f, 968.6f); 





Vv = cos(v); 


那么 cos 函 数 将 对 每 个 分 量 逐 个 求 取 余 弦 值 : 


v= (cos(z),cos(y),cos(z)), 


如 需 进 一 步 了 解 ， 可 以 在 DirectX 文 档 中 的 “HLSL Intrinsic 
Functions”(HLSL 内 置 函数 〉 部 分 找到 内 置 函数 的 完整 列表 。 


B.4.3 常量 绥 冲 区 的 封装 规则 


在 HLSL 中 ， 第 量 缓冲 区 会 以 补 齐 填 充 〈padding) 的 方式 ， 将 其 中 
的 元 素 都 包装 为 4D 问 量 ， 但 一 个 单独 的 元 素 却 不 能 被 分 开 并 横路 两 个 


4D 癌 量 。 思 考 下 列 示例 : 


// HLSL 
cbuffer cb : register(b6) 
{ 


float3 Pos; 
float3 Dir; 


了 








如 采 要 将 数据 打包 为 4D 辐 量 ， 则 有 读者 可 能 会 认为 它 是 这 样 来 实 
现 的 : 


vector 1: (Pos.x, Pos.y, Pos.z, Dir.x) 


vector 2: (Dir.y, Dir.z, empty, empty) 








然而 ， 这 种 方法 却 把 dir 元 素 分 置 在 两 个 4D 疝 量 之 中 ， 这 在 HLSL 
的 规 见 一 个 元 素 只 能 置 于 一 个 4D 向 量 之 内 。 因 此 ， 
必须 按 下 列 方式 封装 在 着 色 器 的 内 存 之 中 。 








vector 1: (Pos.x, Pos.y, Pos.z, empty) 





vector 2: (Dir.x, Dir.y, Dir.z, empty) 


现 假设 我 们 用 C++ 语言 定义 的 即将 被 映射 到 常量 缓冲 区 中 的 结构 体 
由 下 5 


// C++ 
struct Data 


XMFLOAT3 Pos; 
XMFLOAT3 Dir; 
}; 








如 果 没 有 留意 这 些 封装 规则 ， 而 盲目 地 调用 memcpy 函 数 以 复制 字 
节 的 方式 将 数据 写 入 常量 缓冲 区 里 ， 那 么 将 以 上 面 所 述 的 第 一 种 错误 情 


景 而 告终 ， 而 癌 量 数据 也 将 被 错误 地 赋值 为 : 


vector 1: (Pos.x, Pos.y, Pos.z, Dir.x) 


vector 2: (Dir.y, Dir.z, empty, empty) 





如 此 说 来 ， 我 们 必须 依照 HLSL 的 封装 规则 以 “填充 ?变量 的 方式 来 
定义 C++ 结构 体 ， 以 此 使 其 中 的 数据 元 素 可 正确 地 复制 给 HLSL 中 的 禹 
量 。 现 在 ， 我 们 用 显 式 填充 的 方法 来 重新 定义 常量 缓冲 区 。 





cbuffer cb : register(b6) 


float3 Pos ; 
float pade; 
float3 Dir; 
float padil; 


了 





再 定义 C++ 代码 中 的 结构 体 ， 以 求 与 常量 缓冲 区 相 匹 配 。 


// C++ 
struct Data 


XMFLOAT3 Pos; 
float pade; 
XMFLOAT3 Dir; 
float padil; 
}; 





如 果 现 在 再 调用 memcpy 函 数 ， 那 么 数据 将 被 正确 地 复制 到 常量 绥 
冲 区 之 中 。 


vector 1: (Pos.x, Pos.y, Pos.z, __pade) 





vector 2: (Dir.x, Dir.y, Dir.z, _ pad1) 


为 遵循 封 滚 规则 ， 本 书 中 的 部 分 代码 可 能 会 采取 填充 变量 的 方法 。 





另外 ， 在 茶 些 情况 下 ， 如 果 对 第 量 缓冲 区 中 的 元 素 顺 序 进 行 适 当 调 整 ， 
或 许 就 能 因 减 少 占 位 的 空白 空间 而 避免 填充 操作 。 例 如 ， 厦 按 下 列 方式 
定义 Light 结 构 体 ， 我 们 束 不 必 再 填充 4D 同 量 的 w 坐 标 了 一 一 依 此 顺序 
排列 的 结构 体 元 素 使 标量 数据 自然 而 然 地 占据 了 uw 坐标 的 位 置 (8.13.1 市 
曾 提 及 相关 内 容 ) 。 








struct Light 


DirectX: :XMFLOAT3 Strength; 
float FalloffStart = 1.6f; 
DirectX: :XMFLOAT3 Direction; 
float FalloffEnd = 16.60f; 
DirectX: :XMFLOAT3 Position; 
float SpotPower = 64.6f; 








当 这 些 数据 元 素 写 入 常量 缓冲 区 时 ， 它 们 会 严 丝 合 颖 地 打包 为 3 个 
4D 癌 量 。 


vector 1: (Strength.x, Strength.y, Strength.z, FalloffStart) 


vector 2: (Direction.x, Direction.y, Direction.z, FalloffEnd) 
vector 3: (Position.x, Position.y, Position.z, SpotPower) 








最 好 按 着 色 器 内 存 中 的 常量 缓冲 区 内 存 布局 来 定义 C++ 常 量 缓冲 区 
数据 结构 体 ， 使 两 者 匹配 。 届 时 ， 我 们 就 可 以 无 后 顾 之 忧 地 进行 内 存 复 
制 操作 。 


刚刚 摸 清 了 HLSL 包 装 与 填充 的 路 数 ， 现 在 不 妨 就 让 我 们 多 研究 几 
种 HLSL 常 量 包 装 的 实例 。 如 果 有 以 下 常量 缓冲 区 : 


cbuffer cb : register(b6) 
{ 


float3 v; 
float 5s; 
float2 p; 
float3 9q; 





那么 ， 这 一 结构 体 将 经 过 填充 打包 而 成 为 下 列 3 个 4D 辣 量 : 


vector 1: (v.X, V.y, V.z, Ss) 
vector 2: (p.x, p.y, empty, empty) 
vector 3: (q.x, qd.y, 9q.z, empty) 





在 这 种 情况 下 ， 我 们 将 标量 s 置 为 第 一 个 向 量 中 的 第 4 个 分 量 。 然 
而 ， 癌 量 2 的 槽 位 还 是 不 能 同时 容 下 变量 p 与 9g， 因 此 q 必 须 单独 占用 一 个 
4D 辣 量 。 


又 如 ， 考 虑 这 样 一 个 闻 量 缓冲 区 : 


cbuffer cb : register(b6) 
{ 
float2 u; 
float2 v; 


float a0; 
float al; 
float a2; 








它 将 被 填充 并 封装 为 : 


vector 1: (U.X, U.y, V.X, Vv.y) 
vector 2: (a0, al, a2, empty) 


注 Note i 


数组 的 处 理 方式 与 上 文 所 述 不 同 。 根 据 SDK 文 档 可 知 , “数组 中 的 
每 个 元 素 都 会 被 存 于 一 个 具有 4 个 分 量 的 回 量 之 中 ”。 请 看 下 面 的 示例 ， 
如 果 我 们 有 一 个 类 型 为 float2 的 数组 : 


float2 Texoffsets[8]; 


根据 前 文中 的 封闭 规则， 我 们 可 能 会 认为 每 两 个 元 素 会 被 包装 到 一 
个 float4 类 型 的 槽 位 之 中 。 但 是 ， 数 组 却 是 个 例外 ， 上 述 数组 实际 相当 








了 


float4 TexOffsets[8]; 


因此 ， 为 了 令 程 序 能 按 预 期 正常 工作 ， 我 们 需要 在 C++ 代码 中 设置 
一 个 具有 8 个 XMFLOAT4 元 素 的 数组 ， 而 不 是 由 8 个 XMFLOAT2 元 素 所 
构成 的 数组 。 显 而 易 见 的 是 ， 每 个 元 素 都 浪费 了 两 个 float 类 型 的 存储 空 
间 ， 毕 竟 我 们 其 实 只 需要 一 个 float2 类 型 的 数组 。 对 此 ，SDK 文 档 指 
出 ， 我 们 可 以 通过 强制 类 型 转换 以 及 额外 的 地 址 计算 指令 来 更 有 效 地 利 
用 内 存 : 


float4 array[4]; 
static float2 aggressivePackArray[8] = (float2[8])array; 








[1] 本 章 内 容 均 为 HLSL 中 的 常用 语法 ， 便 于 快速 查阅 ， 完 整 细节 请 参 
考 MSDN 库 。 随 着 Direct3D 的 更 新 与 升级 ， HLSL 则 有 与 之 对 应 的 着 色 
器 模型 (shader model, SM) ，Direct3D 12 的 对 应 模型 有 SM 5.1 与 SM 





6.X。 


[2] 其 中 的 关键 字 decl (与 着 色 器 汇编 语言 有 关 ) 已 不 在 官方 的 HLSL 
列表 之 中 ， 它 仪 残 存在 Directx 9 的 某 些 文献 当中 。 


[3] 其 中 的 namespace 与 register 现 已 属于 关键 
字 ，break、continue 与 switch 则 已 归 入 流 控制 语句 。 


附录 C 解析 几何 学 选 讲 


在 本 附录 中 ， 我 们 将 以 网 量 与 点 为 基石 来 构建 出 更 为 复杂 的 几何 图 

。 本 书 中 虽然 经 种 会 用 到 这 些 知 识 ， 但 仍 不 如 癌 量 、 和 窍 阵 以 及 变换 这 
0 导 频 繁 。 正 因 如 此 ， 我 们 才 把 这 些 主题 放 到 附录 中 而 非 正文 
当中 。 





C.1 射线 、 直 线 以 及 线段 








一 条 直线 可 以 用 线 上 一 点 Po 以 及 与 此 线 平 行 的 向 量 w 来 表示 《〈 见 图 
。 所 以 ， 此 直线 的 向 量 直 线 方程 (vector line equation ) 为 : 


p(t) =po+tu ”其 中 teR 


过 赋予 :+t 可 以 是 任意 实数 ) 不 同 的 值 ， 我 们 就 能 获得 此 直线 上 
的 不 同 反 。 





如 末 将 t 限 制 为 一 个 非 负 数 ， 那 么 这 个 癌 量 直线 方程 的 图 像 将 变 为 
以 Po 作为 端点 、 回 量 w 表 示 方 癌 的 射线 〈 见 图 C.2) 。 





Do—2u 








线 上 一 点 PO 以 及 与 此 线 平 行 的 向 量 U 来 描述 的 直线 。 我 们 可 以 通过 为 t 设 置 任意 实数 
来 得 到 直线 上 的 对 应 点 


图 C.1 




















图 C.2 ”由 端点 P0 与 方向 向 量 w 所 描述 的 射线 。 我 们 通过 为 t 设 置 大 于 或 等 于 0 的 标量 来 生成 该 射 
线 上 的 对 应 点 





现 假 设 欲 通过 端点 Po 与 ?来 定义 一 条 线段 。 首 先 要 构建 出 由 Po 至 Pl 
的 向 量 * = P1 一 po， 如 图 C.3 所 示 。 接 下 来 ， 针 对 # < 0, 1 绘制 出 方程 
P(t) = Po+ tu =Po+tP1 一 Po) 的 图 像 ， 即 为 由 Po 与 Pi 所 定义 的 线段 。 注 
意 ， 如 果 我 们 在 绘制 图 像 时 没有 满足 ! < |0; 1 这 个 条 件 ， 那 么 我 们 所 给 
制 的 点 将 位 于 该 线段 所 在 的 直线 上 ， 但 不 在 此 线段 之 上 。 


pot om ee », 
- 
了 -一 人 
全 了 
_ 0 十 0.754 
5 一 
0 .po + 0.25u 

















图 C.3 通过 为 赋予 范 围 为 [0, 1] 的 值 来 生成 线段 上 的 点 。 例 如 ， 当 t = 0.5 时 ， 便 生成 线段 的 中 
点 。 观察 图 像 可 知 ， 当 t 二 0 时 ， 我 们 得 到 的 是 端点 Po， 当 t = 1]， 就 可 得 到 端点 P1 


AN 

















C2 平行 四 地形 





设 9 为 一 个 点 ， 且 w 与 v 为 两 个 非 平 行 铝 量 〈 即 对 于 任意 标量 k 来 讲 ， 
刀 隆 Kv) 。 下 列 函 数 的 图 像 即 为 一 个 平行 四 边 形 《〈 见 图 C.4) 。 


pls.t)=gqg+sut+tv 其 中 ste [0, 1] 





图 C.4 ”一 个 平行 四 边 形 。 通 过 为 5; { € |0，1] 这 两 个 变量 取 约束 范围 内 的 不 同 值 ， 我 们 就 能 根 
据 上 述 方程 生成 对 应 平行 四 边 形 中 不 同 的 点 











需要 满足 “对 于 任意 标量 都 要 使 4 坟 &o” 这 个 条 件 的 原因 如 下 。 


如 果 u = hv, 那么 就 有 : 


pls.t)=gqg+sut+tv 
一 gg 十 SAD 十 tt 
一 Qg 十 (sK 十 如 7 
二 4 十 tv 


这 其 实 就 是 直线 方程 。 换 名 话说， 我 们 现在 得 到 的 是 一 个 单 自由 度 
(one degree of freedom， 也 作 一 自由 度 ) 方程 。 而 要 获得 像 平 行 四 边 形 











那样 的 2D 几 何 形状 ， 则 必须 采用 双 上 自由 度 《〈 二 目 由 度 ) 方程 。 因 此 ，z 
与 v 必 不 能 互 为 平行 问 量 。 





C.3 三 角形 














三 角形 的 问 量 方程 与 平行 四 边 形 的 癌 量 方程 送 不 多 ， 唯 一 区 别 就 是 
前 者 更 进一步 限制 了 参数 的 范围 : 


p(s,t)j=po+sut+tv 其 中 s 交 0it 关 0,s+t 委 1] 


从 图 C.5 中 可 以 看 出 ， 如 果 在 与 、t 有 关 的 条 件 里 有 任何 一 项 没有 得 
到 满足 ， 那 么 Pls; 1) 则 为 在 三 角形 所 在 平面 上 ， 却 处 于 三 角形 范围 “之 
外 ”的 一 个 后。 





图 C.5 一 个 三 角形 。 通 过 为 参数 5s、t 取 满足 5 之 0,t 之 0, 5 十 t < 1 的 不 同 值 ， 我 们 就 可 以 生 
成 此 三 角形 内 的 不 同 点 





根据 定义 三 角形 的 3 个 点， 我 们 残 能 得 到 三 角形 的 参数 方程 。 现 考 
碟 由 3 个 顶点 Po、P1i、B 所 定义 的 三 角形 。 我 们 可 以 把 满足 
5 之 0,t 之 0,s+t < 1 的 位 于 三 角形 内 的 任意 一 点 表示 为 : 








p(s,1) = po + s{p1 ~— Po) + t(p, — po) 


根据 标量 乘法 对 向 量 加 法 分 配 律 ， 对 公式 进一步 展开 : 


pls,t) = po + sp1 — spo + tp 一 如 0 
=1—s—tpot+ spit+tp, 
= Tho + sp1 十 tp 
这 里 设 " = (1 一 s 一 妇 。 举 标 (7; s 改 则 称 为 重心 坐标 〈barycentric 

coordinate) 。 注 意 ， 通 过 约束 条 件 "+s+t= 1 与 重心 组 合 
Pl7,s,t) 二 TPo 十 5P1 十 tpo 便 可 将 点 Pp 表 示 为 三 角形 3 个 顶点 的 加 权 平 均 
值 。 重 心 坐 标 还 有 一 些 有 趣 的 性 质 ， 由 于 本 书 没 有 涉及 这 些 内 容 ， 因 此 
就 没有 将 它们 一 一 列 出 。 感 兴趣 的 读者 不 妨 对 重心 坐标 展开 进一步 的 研 


分 ~ 


九 。 


C.4 平面 








我 们 可 以 把 一 个 平面 视 为 一 张 无 限 薄 、 无 限 宽 以 及 无 限 长 的 “三 
无 ” 纸 。 一 个 平面 可 以 用 一 个 向 量 n 与 平面 内 一 点 Po 来 表示 。 垂 直 于 平面 
的 问 量 mw〔 不 一 定 上 共有 单位 长 度 ) 称 为 该 平面 的 法 同 量 (normal 
vector) ， 如 图 C.6 所 示 。 一 个 平面 可 以 将 空间 划分 为 正六 空间 (positive 
half-space) 与 负 半 空间 (negative half-space) 。 正 半空 间 为 平面 前 侧 的 
空间 ， 所 谓 “ 平 面 的 前 侧 ? 即 为 法 同 量 指 同 的 一 侧 。 负 半空 间 则 为 平面 后 
侧 的 空间 。 








图 C.6 ”通过 法 向 量 n 与 平面 内 一 点 Po 定义 的 平面 。 如 果 Po 是 平面 内 一 点 ， 当 且 仅 当 向 量 
Pp 一 Po 正 交 于 平面 法 向 量 ， 则 点 P 也 是 平面 内 一 点 












































从 图 C.6 可 以 看 到 ， 平 面 的 图 像 是 由 所 有 满足 下 列 平 面 方程 (plane 
equation〉 的 点 P 所 构成 的 : 
n:(p— po)=0 
在 描述 一 个 特定 平面 的 时 候 ， 法 线 m 与 平面 内 的 一 已 知 点 Po 都 是 确 
定 下 来 的 ， 因 此 通 负 可 以 将 平面 方程 改写 为 ; 





n:(p—p0)=n:p—-n:po=n:p+d=0 





以 写作 : 


ar+by+cz+d=0 
如 果 平 面 法 向 量 n 为 单位 长 度 ， 那 么 4 = 一 Po 表 示 的 就 是 从 坐标 系 


原点 至 此 平面 的 最 短 有 从 号 (signed， 或 称 为 “有 疝 ”) 距离 〈 见 图 
人 7 














图 C.7 ”从 平面 到 坐标 系 原点 的 最 短 距离 


为 了 能 更 方便 地 男 出 示意 图 ， 我 们 有 时 绘制 的 是 2D 图 像 。 此 时 ， 
用 一 条 直线 来 表示 一 个 平面 。 由 于 一 条 直线 可 以 把 2D 空 间 分 为 一 个 正 
半空 间 以 及 一 个 负 半 空间 ， 所 以 通过 一 条 直线 以 及 一 条 与 之 垂直 的 法 线 
就 能 合理 地 表示 出 2D 和 平面 。 











C.4.1 DirectX 数 学 库 中 平面 的 表示 








在 代码 中 表示 平面 时 ， 存 储 法 向 量 n 与 常量 4 是 一 件 很 容易 的 事 。 将 
这 两 种 数据 看 作 一 个 4D 癌 量 是 一 种 很 不 错 的 想法 ， 我 们 可 以 把 它们 表 
示 为 (7,4) = (a,b,c,d)。 又 因为 XMVECTOR 类 型 所 存 的 正 是 一 个 浮 点 数值 
四 元 组 ， 所 以 DirectX 数 学 库 也 提供 了 XMVECTOR 类 型 的 重 载 用 于 表示 平 
面 。 


C.4.2 ”空间 点 与 平面 的 位 置 关系 


给 出 任意 一 点 P， 从 图 C.6 与 图 C.8 中 可 以 看 出 : 

1， 如果 ?四 一 po) 二 nn.P+d>0， 那 么 点 Pp 位 于 平面 的 前 侧 空间 。 
2. 如 果 n (Pp 一 Po) 二 nn.P+d<0， 那 么 点 P 位 于 平面 的 后 侧 空间 。 
3. 如 果 n (Pp 一 Po) = npP+d=0， 那 么 点 P 在 平面 内 。 


这 几 种 测试 对 于 空间 反 与 平面 位 置 关系 的 判断 是 很 有 用 处 的 。 





图 C.8 空间 点 与 平面 的 位 置 关 系 





以 下 DirectX 数 学 库 函数 用 于 为 特定 平面 与 点 计算 n-p+d， 











XMVECTOR XMPlaneDotCoord(// 返回 每 一 个 坐标 分 量 都 存 有 np+d 计 算 结 果 的 XMVECTOR 
XMVECTOR P，// 用 平面 系数 (a，b，c，d) 来 表示 的 平面 
XMVECTOR V); // 用 分 量 w = 1 来 表示 的 点 





























// 检测 点 与 平面 的 相对 位 置 关 系 
XMVECTOR p = XMVectorset(6.06f, 1.6f, 6.6f, 0.6f); 





XMVECTOR V = XMVectorSet(3.6f, 5.6f, 2.06f); 


float x = XMVectorGetX( XMPlaneDotCoord(p, v) ); 
if( x 约 等 于 6.6f ) // 点 v 在 平面 p 内 
>0) 
<0) 








if( x // 点 v 处 于 正 半空 间 
if( x // 点 v 处 于 负 半 空间 








注音 Note ww 


上 述 代码 中 所 说 的 “ 约 等 于 ”是 由 于 浮 点 值 的 误差 所 致 。 








类 似 的 函数 有 : 


XMVECTOR XMPlaneDotNormal (XMVECTOR Plane, XMVECTOR Vec); 


此 函数 将 返回 平面 法 向 量 与 指定 的 3D 向 量 的 皮 积 。 


C.4.3 构建 平面 


除了 直接 指定 平面 系数 td = (aoc dg 之 外 ， 还 可 以 用 另外 两 种 方 
式 来 计算 这 些 系数 。 给 出 法 线 n 与 平面 内 一 已 知 点 Po， 就 能 解 出 d: 





n: Do +d=0 字 d=—n “Po 





DirectX 数 学 库 提 供 的 以 下 函数 ， 将 根据 给 出 的 平面 内 一 点 与 法 线 
来 构建 一 个 对 应 的 平面 : 
XMVECTOR XMPlaneFromPointNormal( 


XMVECTOR Point, 
XMVECTOR Normal); 


第 二 种 构建 平面 的 方式 是 指定 目标 平面 内 3 个 不 共 线 的 点 。 


给 出 平面 内 不 共 线 的 3 点 Pn?、P1、P2， 我 们 就 能 表示 此 出 平面 内 的 两 
个 同 量 : 
u=P1— Po 
7 二 也 "一 20 
据 此 ， 我 们 就 可 通过 这 两 个 平面 内 同 量 的 又 积 ， 计 算出 此 平面 的 法 
线 (回顾 左手 拇指 法 则 (left hand thumb rule) ) : 


n=uxv 
接 下 来 ， 我 们 就 能 计算 4 = 一 n Po 了 。 


相应 地 ，DirectX 数 学 库 还 提供 了 下 列 函数 ， 用 以 根据 用 户 给 出 的 3 
个 不 共 线 点 ， 计算 其 所 在 的 平面 : 


XMVECTOR XMPlaneFromPoints( 
XMVECTOR Point1, 
XMVECTOR Point2, 
XMVECTOR Point3); 


C.4.4 对 平面 进行 规范 化 处 理 


有 时 候 ， 我 们 可 能 需要 对 一 个 平面 的 法 癌 量 进行 规范 化 处 理 。 乍 一 
想 ， 对 法 回 量 进行 规范 化 处 理 的 方式 似乎 应 当 与 处 理 其 他 回 量 的 方法 差 
不 多 。 但 是 又 考虑 到 d 项 的 表示 也 依赖 于 法 向 量 : 《= Po， 因此， 如 
果 要 对 平面 的 法 向 量 进行 规范 化 处 理 ， 势 必要 重新 计算 4。 这 可 以 通过 
下 述 方 法 来 实现 : 











d n 





eal Im 





这 样 一 来 ， 我 们 就 得 到 了 下 列 对 平面 (n, 的 法 向 量 进行 规范 化 处 
理 的 公式 : 
1] , n d 
I ™ 06， 上 


男 外 ， 我 们 可 以 通过 下 述 DirectX 数 学 库 函 数 来 对 平面 的 法 向 量 进 
行规 范 化 处 理 : 


C.4.5 ”对 平面 进行 变换 





[Lengyel02] 证 明了 : 如 果 要 对 一 个 平面 (n, 中 进行 某 种 变换 ， 可 以 
先 将 它 当 作 一 个 4D 辣 量 ， 再 令 它 乘 以 所 需 变 换算 阵 的 逆转 置 算 阵 即 


可 。 注 意 ， 在 变换 之 前 ， 首 先 要 保证 平面 的 法 向 量 必须 是 规范 化 的 。 可 
采用 下 列 DirectX 数 学 函数 库 来 实现 平面 的 变换 : 


XMVECTOR XMPlaneTransform(XMVECTOR P, XMMATRIX M); 
示例 代码 : 


XMMATRIX T(...); // 将 T 初 始 化 为 所 需 的 变换 矩阵 
XMMATRIX invT = XMMatrixInverse(XMMatrixDeterminant(T), T); 
XMMATRIX invTransposeT = XMMatrixTranspose(invT); 


XMVECTOR p = (...); // 初始 化 平面 
p = XMPlaneNormalize(p); // 确认 法 线 是 规范 化 的 











XMVECTOR transformedPlane = XMPlaneTransform(p, &invTransposeT); 


C.4.6 平面 内 离 指定 点 最 近 的 点 


假设 有 一 空间 点 Pp， 现 欲求 出 平面 (n, 4d) 内 至 点 P 最 近 的 一 点 9q。 从 图 
C.9 可 以 观察 到 : 


d =Pp— proj,(p— Po) 








图 C.9 ”到 点 P 最 近 的 平面 内 一 点 。 图 中 的 Po 亦 为 平面 内 的 点 














假设 |n|| = 1， 因 此 有 Proin(p 一 po) = [(p 一 po) -njn， 我 们 就 能 将 上 


式 改写 为 : 


q=pP—|p—pPo):nn 
=pPD—(p:n—po:n)n 
=pD—{(p:n+d)n 


C.4.7 ”射线 与 平面 的 相交 检 训 


指定 一 条 射线 Pt = Po + 志 与 一 个 平面 的 方程 :P+d = 0， 我 们 就 
能 知道 射线 与 平面 是 售 相 交 以 及 相交 时 的 交点 。 为 此 ， 我 们 要 将 射线 代 
入 平面 方程 ， 并 解 出 满足 此 平面 方程 的 参数 :， 继 而 根据 参数 t 求 出 两 者 
的 交点 。 





将 射线 代入 平面 方程 





n:(pot+tu)+d=0 根据 射线 方程 进行 其 换 





n-:pot+tn:uwt+d=0 向 量 点 积 的 分 配 律 


tn = npo— d 两 侧 同 时 加 上 一 人 Po 一 d 


nn: U 


如 果 n.w = 0， 那 么 射线 与 平面 平行 ， 而 方程 不 是 无 解 就 是 有 无 穷 














多 个 解 〈《 如 果 射 线 在 平面 内 ， 那 么 此 方程 就 有 无 穷 多 个 解 ) 。 如 果 ;+ 不 


在 区 间 [0, xc) 内 ， 那 么 射线 不 与 平面 相交 ， 但 该 射线 所 在 直线 与 平面 相 
交 (因为 射线 整体 位 于 某 半空 间 ， 背 平面 而 行 》。 若 t 位 于 区 间 [0, cc) 


—n-:po—d 


内 ， 那 么 射线 与 平面 相交 ， 而 且 可 以 通过 1 为 *””n-w ”的 射线 方程 
求 出 二 者 的 交点 。 





射线 与 平面 的 相交 检测 可 以 方便 地 改作 线段 与 平面 的 相交 检测 。 知 
给 出 定义 一 条 线段 的 两 个 端点 与 4， 那么 就 可 以 用 它们 来 构建 射线 
rlt) =P+tlq 一 P)。 下 面 我 们 要 将 这 条 射线 用 于 相交 检测 。 如 果 t El0, 了 
， 那 么 线段 与 平面 相交 ， 人 否则 就 不 相交 。DirectX 数 学 库 为 此 而 提供 了 
以 下 函数 : 

XMVECTOR XMPlaneIntersectLine( 

XMVECTOR p， 


XMVECTOR LinePoint1， 
XMVECTOR LinePoint2); 


C.4.8 反射 问 量 





指定 一 个 同 量 上 ， 欲 求 出 它 关 于 东平 面 法 线 m 的 反射 同 量 。 由 于 癌 量 
没有 位 置 的 概念 ， 因 此 只 得 用 平面 法 线 来 参与 反射 向 量 的 计算 。 图 C.10 
展示 了 这 种 情况 下 的 几何 关系 。 此 时 可 通过 以 下 公式 来 求 出 反射 向 量 : 





r=T—2(n: Tn 


u(T:u)z— 














图 C.10 计算 反射 向 量 的 几何 图 示 


C.4.9 反射 点 


由 于 点 具有 位 置 的 概念 ， 因 此 加 量 与 点 的 反射 是 不 同 的 。 图 C.11 所 
示 的 反射 点 4 可 以 表示 为 : 


q 一 卫 一 2proj,( 了 一 P0) 





图 C.11 计算 反射 点 的 几何 示意 图 


C.4.10 反射 矩阵 


设 (. 相 = (rm 四 为 一 个 平面 的 方程 系数 ， 其 中 4 = -ma :Po。 接 
下 来 ， 利 用 齐 次 坐标 ， 我 们 就 能 仅 通过 一 个 4 x 4 反射 矩阵 来 求 出 关于 此 
平面 的 反射 点 与 反射 向 量 : 


1 一 2nznz —2n7ny —2nmny 0 
—2nmny 1—2nyny —2nyn: 0 

R 四 t . £ t . t 
一 272z71- —2nyn: 1—2n.n:. 0 
—2dnzr —2dn, —2dn. ] 





利用 此 窃 阵 的 前 提 是 ， 假 设 目标 平面 已 经 过 规范 化 处 理 ， 因 此 : 
projn(pP — Po) = —In: (Pp — po)ln 
= —In:(p— po)n 


= In:p+dn 


如 宁 令 一 个 点 与 此 矩阵 相 乘 ， 则 将 得 到 此 点 的 反射 公式 : 


1 —2nmnr —2nny —2nmny 0 
1 —2nmny 1—2nyny —2nyn: 0 
)7, Dy, DP:, , - . 
Pr, Py P: 一 272z7- —2nyn: 1—2n.n:. 0 
—2dnz —2dn, —2dn. l 
5 : 工 
pr 一 2pzmnaznzr —2pyniny —2p:nin. —2dnz 
_9 三流 二 二 
2prnzrny 2pynyny —2p:nyn: —2dn, 
一 2Pzr72r72。 —2pynyn:. —2p:n.n. —2dn. 
1 
工 4 ‘IT 
Dr —2nz(prnzt pynyt pn:+td) 
P| —2ny(prnz + pynyt pn:t+d 
p: —2n.(prnz t+ pynyt+p:n:+d 


] 0 


pr 本 —2ni(n:p+d) 
py |—2n,(n:p+d) 
-一 TT ed 
p: —2n.(n :p+d) 
1 0 
=p—2n:p+dn 
= Pp— 2projn(p 一 Po) 


注音 Note p> 


在 推导 的 过 程 中 ， 我 们 利用 转 置 性 质 把 行 向 量 转换 为 列 向量 。 这 样 
就 可 以 使 公式 的 表示 更 为 简洁 ， 否 则 将 得 到 一 长 串 的 行 癌 量 。 








类 似 地 ， 如 果 令 一 个 回 量 与 此 矩阵 相 乘 ， 则 将 得 到 此 癌 量 的 反射 公 
式 : 


1 —2nmnr —2nrny —2nn.: 0 
—2Nnrn 1 一 2nun —2nun: 0 | 
vz, Uy, Us, 0] 1 y Y 了 =v—2(n:.v)n 
! —2n7n. —2nyn: 1—2n.n. 0 
—2dnz —2dn, —2dn. 1 


以 下 DirectX 数 学 库 函 数 能 够 根据 给 定 的 平面 构造 出 上 述 反 射 窍 
阵 : 


XMMATRIX XMMatrixReflect(XMVECTOR Reflectionplane); 


C.5 练习 


1. 设 P(t) = (也 十 女 2; 1 为 一 条 相对 于 某 坐 标 系 的 射线 。 试 绘制 当 
t 二 0.0、0.5、1.0、2.0 以 及 5.0 时 该 射线 上 的 对 应 点 。 


2. ee 。 试 证 明 线 段 方程 也 可 以 
写作 ， 当 t E [0, 1] 时 ， = (1 po + tp 
3. 根据 每 组 中 的 两 点 坐标 ， 求 取 对 应 直线 的 风量 直线 方程 。 


(2) Pi = (2,—1) p, = (4,1) 


(b) Pi = (4, —2, 1) Do = (2, 3, 2) 
4. 设 L(t) = 了 +t 定义 了 一 条 3D 空 间 中 的 直线 。 设 gq 为 3D 空 间 中 的 
任意 一 点 。 试 证 明 点 g 至 此 直线 的 距离 可 以 写作 〈 见 图 C.12) : 


,_ a-p) x 
th 一 





ul 








图 C.12 ”由 点 4 至 目标 直线 的 距离 





5. 设 L(t) = (4,2,2) + tl 11) 为 一 条 直线 。 试 求 出 下 列 各 点 至 此 直 
线 的 距离 : 


(a) g = (0,0,0) 
(b) g = (4,2,0) 
(c) g = (0,2,2) 


6， 设 Po = (0,1,0)，Pi = (一 1, 3,6) 与 ps = (8,5,3) 为 3 个 点 。 试 求 出 由 
这 3 点 所 定义 的 平面 。 


1 1 1 
7. ol Waa 2 定义 空间 (3V3. 5V3,0). 
局 2V3)b 及 (V3 一 V3.0) 相 对 于 此 平面 的 位 置 关系 。 





Wy 
[Bw 
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1 1 加 
0 
( Ws i 试 求 出 到 点 (0, 1 0) 最 近 的 平 








ne 
的 反射 点 。 





EE 
10. a 3 Va 3 > Br7(t) = (-1,1,—1) +t(1,0,0) 
A 0 试 求 出 这 条 射线 与 上 述 平面 的 交点 。 接 着 再 编写 一 个 简短 


的 程序 ， 通 过 XMP1aneIntersectLine 函 数 来 验证 答案 的 正确 性 。 
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